著者
北添徹郎 金星一 市来 知幸
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.1999, no.14, pp.25-30, 1999-02-05

奥行き知覚のメカニズムとして知られているステレオビジョン神経回路方程式を用いて音声認識への適用を試みる。数年前ラインマンおよびハーケンにより提案され、最近本研究室で発展させられた競合と協調によるステレオビジョン神経回路を用いる。我々は、各音韻の特徴量が脳に蓄積されており、入力音声がそれらと比較され、音声認識を行なっていると考える。本研究では24セットの音韻のシミラリティを求め、その上位5つの音韻のみを最終的な候補として、ステレオビジョン神経回路方程式にかける。その結果、216単語データベースにおいては78.05%、240単語データベースにおいては78.94%という音韻の認識率が得られ、HMMによる認識率、各71.56%と72.37%を上回る結果を得た。The stereo vision neural-net equations, known to process a depth perception, are applied to speech recognition. We use a recently developed three layered neural net (TLNN) equations with competition and cooperation for stereo vision. We use a Gaussian PDF to represent memorized data of each phoneme in our memory, and the similarities of an input phoneme with respect to the memorized ones were calculated. The TLNN equations are applied to the similarities with best 5 hypotheses among 24 kinds of phonemes. The average rates for speaker independent recognition are 78.05 % for 216 word database and 78.94 % for 240 word data base by TLNN equations which are compared to 71.56 % and 72.37 % by Hidden Markov Model(HMM), respectively.