著者
北岡 教英 押川 洋徳 中川 聖一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.105, no.496, pp.31-36, 2005-12-15
被引用文献数
3

本稿では, 高頻度単語と短い単語(基本単語)を併用した音声認識を用いた組織名入力インタフェースを提案する.これは, まず音声で組織名を入力し, 音声認識の結果得られた複数の単語・基本単語候補から, ペンタッチで選択, 入力するマルチモーダルインタフェースである.組織名といった語彙サイズが大きく, 常に新しい組織名が生み出されるため, すべてを登録することが難しく, また音声認識が難しいタスクに対し, 単語認識と連続基本単語認識を併用するもので, 認識対象のカバー率と認識性能, 入力効率の両方の向上を図った.そして, その認識結果から単語・基本単語系列候補, 基本単語候補をタッチパネルに表示し, ペンタッチにより簡単に選択して入力が可能な組織名入力インタフェースを考案した.この高頻度単語と基本単語を併用した音声認識をオフラインの認識実験により評価したところ, それぞれ単独での音声認識結果より良い結果が得られた.さらにこの認識結果に基づいてインタフェースを用いた場合の入力可能な割合をシミュレーションすると, 約92%で入力が可能となることが分かった.また, このインタフェースを実装してオンラインで被験者実験を行ったところ, 音声認識性能の低下で1回の発声では83.3%の入力可能率となったが, 2回まで音声入力を許すことで93.3%となった.