- 著者
-
全 炳河
徳田 恵一
北村 正
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
- 巻号頁・発行日
- vol.87, no.8, pp.1593-1602, 2004-08-01
- 被引用文献数
-
1
近年,連続音声認識システムにおける音響モデルとして,前後の音素環境を考慮した音素コンテクスト依存隠れマルコフモデルが広く利用されている.音素コンテクスト依存隠れマルコフモデルを利用する場合,総モデル数が増加し,システムが非常に多くの自由パラメータを含むことになるため,統計的に信頼できるパラメータを推定することが困難になる.このため,様々なパラメータ共有手法が提案されており,中でも音素決定木に基づく状態共有法は,優れた解決法の一つである.しかし,状態単位の共有構造では特徴ベクトルの全次元に同一の共有構造を構築するため,各特徴量に対し,異なる共有構造を構築できない,適切なパラメータ数を割当てることができない,といった問題点がある.本論文では,記述長最小化基準に基づく次元分割法を導入することにより音素決定木を拡張した,音素・次元決定木を提案する.更に,状態位置に関する分割条件を加え,音素コンテクスト・次元・状態位置を決定木に基づき同時にクラスタリングする手法を提案する.不特定話者連続音声認識実験の結果,提案法は従来の音素決定木に基づく状態共有法と比較して13〜15%誤り率を削減することが示された.