著者
神尾 広幸 松浦 博 正井 康之 新田 恒雄
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.77, no.8, pp.1429-1437, 1994-08-25
被引用文献数
31

本論文では,音声入出力を中心としたマルチモーダル対話システムMultiksDialについて述べる.このシステムは,入力手段に音声認識装置とタッチパネル,出力手段に音声規則合成装置とディスプレイを備え,入出力の双方をマルチモーダル化していることが特長である.また補助入力手段に光電センサを使用し,ユーザの状況を検知しながら操作ガイダンスを提示することによって,スムーズな対話を実現している.MultiksDial上に情報案内システムを構築し,ユーザインタフェースの操作性を評価する.入力手段の比較実験結果から,直接指示可能な音声入力は,階層的な指示を必要とするタッチ入力よりも速く操作を完了できること,また初心者では,操作ガイダンスを合成音声で提示することにより,スムーズな対話が行えることを示す.これらの事実から,対話チャネルのマルチモーダル化は,ユーザとシステムとの対話をより効率よく行うのに有効であることが確認された.
著者
桃崎浩平 原 義幸 正井 康之 松浦 博 新田 恒雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.1997, no.16, pp.21-26, 1997-02-07

パーソナルコンピュータの高速化とオーディオチップの標準搭載により,音声合成・認識機能がソフトウェアだけで実現できるようになった.これにともなって,音声を利用したアプリケーションソフトウェアが容易に開発できるような環境が整いつつある.本文では,標準APIの一つである米マイクロソフト社のSAPIを中心に紹介するとともに,OCXを用いる応用ソフトウェア開発について解説する.Contemporary PCs provide sufficient computer power to accommodate Text-to-Speech(TTS) and Speech Recognition(SR) with no additional hardware. On the other hand, the environment for developing speech application software still remains in a big issue. In this paper, we first explain the Microsoft Speech API, as one of the standard APIs for speech technologies, and then present some examples of applocation software using SAPI and speech OCX.