著者
堀 一郎
出版者
東京大学
巻号頁・発行日
1953

博士論文
著者
北岡 教英 赤堀 一郎 中川 聖一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.2, pp.500-508, 2000-02-25
被引用文献数
37

雑音環境下の音声認識の前処理として用いられる, パワースペクトル領域でのスペクトルサブトラクションでは, 音声と雑音の間の相関の影響で雑音除去が十分でないことが指摘されている.本論文では, 相関の影響を抑えるための方法として時間方向スムージングを提案する.これは, パワースペクトルの各成分ごとにスムージングを行うものであり, 統計的に相関の影響を小さく抑えることができる.更に, スムージングによる時間分解能の低下を防いでスムージングをより効果的に実現するために, 短い分析窓長で分析を行う方法を提案する.大語彙(い)単語認識実験により, 時間方向スムージング, 特に短い分析窓を用いた場合に有効であることを示す.また, 時間方向スムージングを用いたスペクトルサブトラクションに, 音響モデルを雑音付加音声で学習する雑音付加学習を併用した場合に, 更に認識率が向上することも示す.