- 著者
-
伊田 政樹
中村 哲
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
- 巻号頁・発行日
- vol.86, no.2, pp.195-203, 2003-02-01
- 被引用文献数
-
18
実環境下で音声認識システムを利用することを考えた場合,入力音声への周囲の環境雑音の混入が避けられず,認識性能の劣化を招く.混入する雑音を予測することは多くの場合困難であり,入力信号と音響モデルの間の雑音環境の不一致が認識性能劣化の原因である.このことから,多様な雑音の混入に対してロバストな音響モデルの構築法が求められている.混入する雑音の問題は雑音の種類の多様性の問題とSN比の多様性の問題の二つに分けて考えることができる.本論文では,前者の問題に対しては雑音GMMの重み適応化によるHMM合成法を用い,後者の問題に対してSN比別のマルチパスモデルを用いることで,これらの問題の解決を試みる.旅行対話タスクとAURORA2タスクによる雑音下音声認識実験により,二つの手法を併用した場合の性能評価を行った.実験の結果,AURORA2タスクSN比=5dBにおいて1秒の適応データを用いた場合,ベースラインのHMMに対して53%の認識率改善を得た.これは従来法のHMM合成では10秒の適応データを用いた場合に匹敵する.