著者
下田 将之 吉沢 真吾 和田 直哉 宮永 喜一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. CS, 通信方式 (ISSN:09135685)
巻号頁・発行日
vol.101, no.670, pp.79-84, 2002-02-26

音声認識のVLSI化は高速演算により実時間処理を可能にし,トータルシステムの負担を大幅に軽減できることから,その実現が望まれている.本稿では,音声認識LSIを作成するためのシステム構成の概要を示す.また,FFTケプストラムとLPCケプストラムの2つの音声分析手法を用いてソフトウェアシステムを構築し,認識性能の評価を行う.FFTケプストラムは,演算が容易で並列処理が可能であり,LPCケプストラムは声道特性を良好に反映できる現在最も主流な分析方法である.認識手法には連続分布型の隠れマルコフモデル(Hidden Markov Model:HMM)を用いる.
著者
早坂 昇 和田 直哉 宮永 喜一 畑岡 信夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DSP, ディジタル信号処理 (ISSN:09135685)
巻号頁・発行日
vol.103, no.146, pp.31-36, 2003-06-19
被引用文献数
1

実環境で音声認識を使用する際,雑音が大きな問題となる.本報告では,ランニングスペクトルにフィルタリングを施し雑音の影響を低減する手法を提案する.ランニングスペクトルとは短時間スペクトルの時間軌跡のことで,音声認識において重要な特徴であることが知られている.提案手法は,パワースペクトルの時間軌跡にローパスフィルタを,対数パワースペクトルの時間軌跡にバンドパスフィルタをかけるというものである.4種類の雑音を人工的に付加した孤立単語認識実験の結果,特に低SNRにおいて現在広く用いられているRASTA法, CMS法に比べ高い認識率を得た.