著者
安藤 ハル 北原 義典 畑岡 信夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.8, pp.1465-1474, 1994-08-25
参考文献数
18
被引用文献数
17

本論文では,マルチモーダルインターフェースの評価システムとして試作した「インテリアデザイン支援システム」について報告し,評価を通して,マルチモーダルインターフェースのユニモーダルに対する優位性と,ユーザにとって望ましいインターフェースの形態について考察している.本システムでは,入力手段として音声とポインティングジェスチャを用い,格文法を利用した情報統合テーブルにより音声入力された文章を解析し,更に,モダリティの入力順序関係から,解析された音声情報とポインティング情報を統合する方式を提案している.20名の被験者を用いて,ポインティングのみによるユニモーダルな入力手段と,音声を加えたマルチモーダルな入力手段との操作性を比較評価した結果,音声とポインティングによる入力手段の方が操作性がよく,マルチモーダルの優位性が確認できた.また,単語(コマンド)発声と,文発声の2種類の音声指示形態による操作性の違いを,現状の音声認識性能条件と,音声認識率が完壁な条件の2種において比較評価した.評価の結果,現状の音声認識性能では,単語発声の方が文発声よりも操作性が良いという結果を得たが,自由発声入力が可能となれば,文発声の方が単語発声よりも操作性が良いということが示唆され,今後の音声認識技術開発の指標が明らかになった.
著者
小窪 浩明 畑岡 信夫 李晃伸 河原 達也 鹿野 清宏
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.50, no.11, pp.2597-2606, 2009-11-15
被引用文献数
1

PC向け連続音声認識プログラムJuliusのSuperHマイコン(SH-4A)への搭載に関して行った処理の高速化と,評価実験について報告する.計算リソースの限られたマイコン上で動作させるため,仮説探索時のメモリ管理の最適化や音響尤度計算の高速化を実施した.語彙数5,000語での評価実験では,最適化前のJuliusの実行速度に対して3.7倍の高速化を実現し,SH-4A上での実時間動作を達成した.また,語彙数20,000単語での評価でも実時間の1.25倍で動作すること確認した.最後に,応用アプリケーションとしてT-Engine上に実装した質問応答システムについて報告する.To expand CSR (continuous speech recognition) software to the mobile environmental use, we have developed embedded version of Julius (Embedded Julius). In this paper, we describe an implementation of the "Embedded Julius" on a SH-4A microprocessor. SH-4A is a high-end MPU with on-chip FPU. However, further computational reduction is necessary for the CSR software to operate real-time. Applying some optimizations (efficient memory management, modified GMS), the "Embedded Julius" achieves real-time processing on the SH-4A. The experimental results show 0.73 x real-time, resulting 3.7 times faster than baseline CSR. We also evaluated the "Embedded Julius" on a large vocabulary task (20,000 words). It shows almost real-time processing (1.25 x RT). Finally, We introduced Q & A guidance systems developed for embedded applications.
著者
早坂 昇 和田 直哉 宮永 喜一 畑岡 信夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DSP, ディジタル信号処理 (ISSN:09135685)
巻号頁・発行日
vol.103, no.146, pp.31-36, 2003-06-19
被引用文献数
1

実環境で音声認識を使用する際,雑音が大きな問題となる.本報告では,ランニングスペクトルにフィルタリングを施し雑音の影響を低減する手法を提案する.ランニングスペクトルとは短時間スペクトルの時間軌跡のことで,音声認識において重要な特徴であることが知られている.提案手法は,パワースペクトルの時間軌跡にローパスフィルタを,対数パワースペクトルの時間軌跡にバンドパスフィルタをかけるというものである.4種類の雑音を人工的に付加した孤立単語認識実験の結果,特に低SNRにおいて現在広く用いられているRASTA法, CMS法に比べ高い認識率を得た.