- 著者
-
大淵 康成
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
- 巻号頁・発行日
- vol.88, no.5, pp.821-832, 2005-05-01
複数のマイクを使った音声認識において, 個々のマイクへの入力の品質が大きくばらついていることがある.そのような場合, それらの入力を重ね合わせることより, 最適なマイクを正しく選ぶことが重要である.本研究では, 同一発声に対する複数チャネルの音声データをもとに, 音声認識に最も適したチャネルを選択する手法として, デコーダに基づくチャネル選択(Decoder-based Channel Selection: DBCS)を提案する.各チャネルの評価には, 従来用いられていた信号対雑音比や音声認識ゆう度などに代わり, デルタケプストラム正規化方式による特徴補償前後の認識仮説の比較に基づく手法を導入する.また, この手法を様々なマイクの組合せからなる部分遅延和アレーと組み合わせることにより, 更に性能向上が得られることを示す.評価実験の結果, デルタケプストラム正規化, チャネル選択, 部分遅延和アレー利用の三つの方式が相補的に働き, 全体として従来の遅延和アレー方式に比べると, 二つの評価データセットに対してそれぞれ35.8%/26.8%の誤り削減率が得られた.