- 著者
-
齊藤 剛史
小西 亮介
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
- 巻号頁・発行日
- vol.90, no.4, pp.1105-1114, 2007-04-01
- 被引用文献数
-
42
本論文では視覚情報を利用して人間の発話内容を理解する,いわゆる読唇において高認識率が得られるトラジェクトリ特徴量を提案する.トラジェクトリ特徴量は,口唇領域または口内領域より計測できる面積とアスペクト比の二つの特徴量をもとに,発話により生じる2特徴量の時間的変化を口形の軌道として表現される.認識はトラジェクトリ特徴量に二次元DPマッチングを適用する.(1)車椅子制御用10単語と(2)数字10単語の動画像において,これまで提案されている特徴量とトラジェクトリ特徴量の比較実験を行った結果,従来特徴量で最も高い認識率は(1)92.5%,(2)72.0%であったのに対し,トラジェクトリ特徴量は(1)99.5%,(2)83.5%の高認識率を得た.また処理速度,発話速度を考慮して擬似的にフレームレートを変更して比較実験を行った結果,従来の特徴量で最も高い認識率は69.5%であるのに対し,トラジェクトリ特徴量では98.0%と高い認識率であった.これより,トラジェクトリ特徴量は発話速度に対してロバストであり,かつ高い認識精度を有することを確認した.