著者
岩野 公司 関 高浩 古井 貞熙
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. SLP, 音声言語情報処理 (ISSN:09196072)
巻号頁・発行日
vol.46, pp.55-60, 2003-05-27
参考文献数
6

本論文では,韻律情報を利用した雑音に頑健な音声認識手法について述べる。韻律特徴量として,時間-ケプストラム平面のハフ変換から得られる対数基本周波数の傾き(△log F_0)と最大累積投票値を利用し,通常の音声認識で用いられる音響特徴量と結合して用いる.音韻と韻律の融合モデルは,音節単位のマルチストリームHMMで構築する.融合モデルの様々な雑音環境における頑健性を確認するため,不特定話者の連続数字発声を対象とした音声認識実験を行った.実験の結果,本手法によって様々な雑音環境において数字正解精度の改善が確認され,△log F_0と最大累積投票値が相補的に認識性能の向上に貢献することがわかった.また,基本周波数情報を音声認識に用いることで,雑音環境下における数字境界の推定精度が向上し,それによって,数字正解精度の改善と,頑健な挿入ぺナルティーの設定が実現されることが確認された.

言及状況

Twitter (1 users, 1 posts, 3 favorites)

CiNii 論文 -  雑音に頑健な音声認識のための韻律情報の利用 https://t.co/2KndZ4pibM #CiNii

収集済み URL リスト