著者
齊藤 剛史 小西 亮介
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.90, no.4, pp.1105-1114, 2007-04-01
被引用文献数
42

本論文では視覚情報を利用して人間の発話内容を理解する,いわゆる読唇において高認識率が得られるトラジェクトリ特徴量を提案する.トラジェクトリ特徴量は,口唇領域または口内領域より計測できる面積とアスペクト比の二つの特徴量をもとに,発話により生じる2特徴量の時間的変化を口形の軌道として表現される.認識はトラジェクトリ特徴量に二次元DPマッチングを適用する.(1)車椅子制御用10単語と(2)数字10単語の動画像において,これまで提案されている特徴量とトラジェクトリ特徴量の比較実験を行った結果,従来特徴量で最も高い認識率は(1)92.5%,(2)72.0%であったのに対し,トラジェクトリ特徴量は(1)99.5%,(2)83.5%の高認識率を得た.また処理速度,発話速度を考慮して擬似的にフレームレートを変更して比較実験を行った結果,従来の特徴量で最も高い認識率は69.5%であるのに対し,トラジェクトリ特徴量では98.0%と高い認識率であった.これより,トラジェクトリ特徴量は発話速度に対してロバストであり,かつ高い認識精度を有することを確認した.
著者
李 咏梅 菅原 一孔 尾崎 知幸 小西 亮介
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DSP, ディジタル信号処理 (ISSN:09135685)
巻号頁・発行日
vol.102, no.167, pp.37-42, 2002-06-20

指数減衰信号の周波数推定手法としてR.Kumaresan及びW.Tufts(KT)によって提案されたKT手法がよく知られている.KT手法では線形後ろ向き予測法と特異値分解が重要な役割を果たしている。しかし,信号の中で雑音が増加した場合,KT手法では周波数の推定は困難である.本論文では、雑音が増加した場合においても,良好な周波数推定を行うための手法を提案する.提案手法では、前向きと後ろ向き線形予測法に基づいて,異なった時間信号区間を用いて信号に対する零点グループを抽出ことにより,信号に含まれる周波数を推定する.シミュレーション結果により,提案手法はKT法に比べ良好な推定結果が得られることを示した.