著者
宮崎 敏彦 須崎 昌彦 久野 裕次 田川 忠道
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.1995, no.73, pp.67-72, 1995-07-20
被引用文献数
2

人とコンピュータの円滑なインタフェース構築を目指して、コンピュータグラフィックスによる顔画像生成と、画像認識,音声対話を統合したシステムを試作した。画像認識部ではディスプレイの前の人物の頭部位置を検出し、検出結果を入力画像毎に対応付けることによって顔画像の視線の動きを自然なものにしている。音声対話部では対話の状態にあった入力手段を提供するなど、ユーザが適切な応答をすることができるサポートをすると同時に、顔画像の表情や動きを変化させることで対話システムの欠点を補っている。さらに、システムの機能を補間するという位置付けで、デスクトップTV会議システムと結合し、システムが対処できない状況では適宜専門化に補助を依頼することもできる。For the purpose of easing human computer interaction, we built a visitor guidance system integrating facial animation by computer graphics, image processing, and speech dialogue. Gaze directions of the facial animation are controlled by detecting head positions of the persons in front of the display and tracking the person who is regarded as the main target. The speech dialogue part gives a user appropriate answers by incorporating an extended plan reasoning method. By changing facial expressions and movements of the facial animation, we can show the states of the system to a user as nonverbal information to make up for the weakness of the speech dialogue such as inaccuracy of voice recognition. We integrated the desktop conference system into our multi-modal interaction system. It can decrease unsolved situations with the assistance of a human expert.