著者
大槻 恭士 大友 照彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. HIP, ヒューマン情報処理 (ISSN:09135685)
巻号頁・発行日
vol.102, no.473, pp.25-30, 2002-11-15

口唇周りのオプティカルフローと単語HMMを用いた駅名発話画像認識システムについて述べる.本システムでは,オプティカルフローの抽出を専用ハードウェア「カラートラッキングビジョン」により行い,得られた特徴ベクトルをベクトル量子化によりシンボルに変換し,離散出力分布型HMMによる学習および認識を行う.特定話者における駅名50単語の認識実験より,平滑化したオプティカルフロー測定値を50画素間隔に間引いた80次元の特徴ベクトルが最も高い認識性能を与えること,状態数26の単語HMMが最も高い認識性能を与えること,また,摂動データを学習データとした場合,位置ずれなしで97%,25画素程度の位置ずれを許容して96.7%,50画素程度の位置ずれを許容しても92.4%と非常に高い認識性能が得られることなどがわかった.