著者
岡部 大介 岡部 愛 平井 智仁 大谷 紀子 岩野 公司
雑誌
第78回全国大会講演論文集
巻号頁・発行日
vol.2016, no.1, pp.521-522, 2016-03-10

本研究では,アニメのキャラクターなどに扮する遊びである「コスプレ」のポージングを協働的に構築していく状況に着目する.コスプレイヤーのポーズと表情をKinectを用いてキャプチャし,顔や身体の各部位間の位置について客観的な指標を得る.コスプレイヤーがキャラクターの特性に関する理想的な表現に近づけていく過程のデータ解析を通して,ポーズの修得や熟達に関する一人称視点での変容が,身体の動きとどのように関係しているのかを,客観的に見ていく.またあわせて,得られた結果に基づいて「表現力」を客観的な数値として自動判定する技術の可能性を検討する.
著者
小平 優希 篠田 浩一 岩野 公司
雑誌
第78回全国大会講演論文集
巻号頁・発行日
vol.2016, no.1, pp.533-534, 2016-03-10

我々は,参加者各自が所有する複数のスマートフォンで録音された多人数会話音声に対し,各参加者の発声区間を推定(話者決定)する手法の提案を行っている.従来手法では,端末ごとに事前収録した所有者単独の発声を用いて各参加者の話者モデルを構築し,最尤モデル系列を探索することで話者決定を行っていた.しかし,実際の会話では他者音声の混入が生じるため,十分な話者決定性能が得られない.そこで本研究では,対象音声に「相互スペクトル減算」を適用して他者音声を低減し,話者モデルを再学習して話者決定に用いる手法を提案する.5セッションの雑談音声を用いて発声区間検出性能(F値)を評価したところ,提案手法により約6%の検出率の向上が確認された.
著者
篠田 浩一 井上 中順 岩野 公司 宇都 有昭
出版者
東京工業大学
雑誌
基盤研究(B)
巻号頁・発行日
2019-04-01

音声に関する音声認識、音声合成、話者認識などの様々なタスクを担当するエージェントが互いに競争・協調・調整しながら個々のタスクを学習する、マルチエージェントによる深層学習基盤を構築する。個々のタスクに関わる音声因子の間の含有・排他・共有などの関係を用いて音声データを因子分解することにより、個々のタスクの性能を高める。マルチタスク学習に比べ、少量・非均一のデータでより高い性能を得ることを目標とする。
著者
岩野 公司 関 高浩 古井 貞熙
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. SLP, 音声言語情報処理 (ISSN:09196072)
巻号頁・発行日
vol.46, pp.55-60, 2003-05-27
参考文献数
6

本論文では,韻律情報を利用した雑音に頑健な音声認識手法について述べる。韻律特徴量として,時間-ケプストラム平面のハフ変換から得られる対数基本周波数の傾き(△log F_0)と最大累積投票値を利用し,通常の音声認識で用いられる音響特徴量と結合して用いる.音韻と韻律の融合モデルは,音節単位のマルチストリームHMMで構築する.融合モデルの様々な雑音環境における頑健性を確認するため,不特定話者の連続数字発声を対象とした音声認識実験を行った.実験の結果,本手法によって様々な雑音環境において数字正解精度の改善が確認され,△log F_0と最大累積投票値が相補的に認識性能の向上に貢献することがわかった.また,基本周波数情報を音声認識に用いることで,雑音環境下における数字境界の推定精度が向上し,それによって,数字正解精度の改善と,頑健な挿入ぺナルティーの設定が実現されることが確認された.
著者
冨塚 美歩 岩野 公司
雑誌
第81回全国大会講演論文集
巻号頁・発行日
vol.2019, no.1, pp.341-342, 2019-02-28

楽曲の検索を行う際に,歌手の声質の類似性に基づいて楽曲推薦を行う手法が検討されている.本研究では,検索インタフェースへの利用を想定して,声質の類似性に基づく歌手の分布マップの作成手法を提案する.提案手法では,それぞれの歌手の歌声から音響モデルを学習し,カルバック・ライブラー情報量を用いてモデル間の距離を計算することで,歌手間の声質の距離を求める.可視化手法としては,多次元尺度構成法や自己組織化マップを用いる.複数被験者による主観評価実験により,作成された歌手マップの表現の適切さを評価した結果,その有用性が確認された.
著者
藤村 春花 岩野 公司
雑誌
第79回全国大会講演論文集
巻号頁・発行日
vol.2017, no.1, pp.75-76, 2017-03-16

本研究では,日本語楽曲の旋律と歌詞のアクセントの対応関係を自動的に分析するシステムを提案する.そのためには,歌詞中の各モーラが,どの音符に割り当てられているかを対応付ける必要がある.そこで,各モーラや区切り文字がどのように音符や休符と対応するかを確率的なスコアとして表現したDPマッチングによる自動対応付け手法を提案する.20パート分の楽曲に対して対応付けを行ったところ,正解率は約90%となった.この手法で求めた「モーラー旋律」の対応を,OJADの韻律予測で付与した「モーラーアクセント」の対応と比較し,「旋律ーアクセント」を対応付けしたところ,誤推定による数%の精度劣化はみられるが,良好な性能が得られることがわかった.