著者
伊田 政樹 中川 聖一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.96, no.92, pp.1-8, 1996-06-13
参考文献数
15
被引用文献数
4

音声認識システムの実用化には高精度認識と実時間処理という2つの課題がある。近年、より大規模な連続音声認識システムが求められており、全ての候補との照合を行なうことなく高精度かつ効率的な探索処理が必要となってきている。ここでは、ビームサーチ法とA^*探索法による認識性能の評価について述べる。認識実験より、ビームサーチ法は最適性が保証されていないが、適当なビーム幅と枝刈りのしきい値を与えることで、最適解を失う可能性は非常に小さくなり、枝刈りによって探索空間を大幅に削減できるために高速処理が可能となる。さらにここでは、ビーム幅の範囲内に最適バスが存在していることから、A^*探索法の探索空間をビーム幅で制限する方法について提案する。
著者
伊田 政樹 中村 哲
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.86, no.2, pp.195-203, 2003-02-01
被引用文献数
18

実環境下で音声認識システムを利用することを考えた場合,入力音声への周囲の環境雑音の混入が避けられず,認識性能の劣化を招く.混入する雑音を予測することは多くの場合困難であり,入力信号と音響モデルの間の雑音環境の不一致が認識性能劣化の原因である.このことから,多様な雑音の混入に対してロバストな音響モデルの構築法が求められている.混入する雑音の問題は雑音の種類の多様性の問題とSN比の多様性の問題の二つに分けて考えることができる.本論文では,前者の問題に対しては雑音GMMの重み適応化によるHMM合成法を用い,後者の問題に対してSN比別のマルチパスモデルを用いることで,これらの問題の解決を試みる.旅行対話タスクとAURORA2タスクによる雑音下音声認識実験により,二つの手法を併用した場合の性能評価を行った.実験の結果,AURORA2タスクSN比=5dBにおいて1秒の適応データを用いた場合,ベースラインのHMMに対して53%の認識率改善を得た.これは従来法のHMM合成では10秒の適応データを用いた場合に匹敵する.
著者
中川 聖一 伊田 政樹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.96, no.449, pp.45-52, 1997-01-17
被引用文献数
1

音声認識システムの評価を行なうにあたって、タスクの複雑性を表す尺度として一般にパープレキシティ (perplexity) が多く用いられている。パープレキシティは情報理論的な意味での平均分岐数を表し、各時点における同定すべき単語数に相当する。しかしこの尺度では文の長さや各時点での分岐数の偏りの正規化が不十分なためにタスクの複雑性を厳密に反映した尺度であるとはいえない。そこで、本稿では音声認識部を統計的にシミュレートしてタスクの複雑性と認識率の関係について検討し、新しいタスクの複雑性の尺度としてSMR-Perplexity (Square Mean Root Perplexity) を提案する。さらに実際の統計的言語モデルを用いた連続音声認識システムの評価に本手法を適用し、本手法の有効性を示す。