- 著者
-
西村 雅史
伊東 伸泰
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
- 巻号頁・発行日
- vol.83, no.11, pp.2473-2480, 2000-11-25
- 被引用文献数
-
26
ディクテーションシステムが実用となった今, 大語彙音声認識の研究対象は, 「読み上げ(read speech)」から自然で自由な発話(spontaneous speech)」へと移行しつつある.このような自由発話については過去に対話音声コーパスを利用して様々な観点からその性質が調べられてきた.しかし, 特に日本語に関してはそのデータ量が統計的手法に基づく大規模な音声認識システムを構築するには不十分であったこともあり, 自由発話の書き起こしを目的とするような大語彙音声認識システムの性能についてはあまり報告されていない.我々は自由発話の認識精度改善を目的として, 放送大学の講義音声を題材とした自由発話コーパスの整備を進めてきた.ここではこのコーパスの概要と, それを用いて作成した自由発話の大語彙音声認識システムの認識性能について報告する.実験の結果, 従来の読み上げを対象とするシステムでは51.5%であった講義音声の単語誤り率が, 16.4%にまで改善された.