著者
山本 秀樹 田川 忠道 宮崎 敏彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.34, no.9, pp.1967-1981, 1993-09-15
被引用文献数
23

近年、英語を母国語とする人と実際に会話をしているような環境の撮供を目的とした環境型のCAIシステムが開発されている。しかし、これらのシステムは英会話の教育において重要な音声こよる会話文の入力機能を持たないため、十分な臨揚感を学習者に提供できていない。またこれらのシステムのいくつかは会話の目的や状況を理解していない学習者を対象としていない。そこで、本諭文では、音声による会話文の入カ機能とビデオを魅話的こ操作する機能の両方を持つこと1こより、会話の臨場感を高めること、および会話の目的や状況を理解していない学習者をも対象とすることを可能にした英会話用知的CAIシステムについて述ぺる。まず対話的に操作可能なビデオと音声による対話機能により、目標のある会話を行う際こ必要な英会譜能力を段階的こ習得可能な指導方法を提案する。次に、音声による会話のシミュレーションを実現するために、音声認識システムをどのようにシステムに統合したかについて述ぺる。さらに教材の作成が容易な会話の知識表現を提案する。本システムは、ワークステーション上に実装されており十分な速度で音声による会話を可能としている。本諭文で述ぺた方式は他の音声対話システムにも応用可能である。
著者
宮崎 敏彦 須崎 昌彦 久野 裕次 田川 忠道
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.1995, no.73, pp.67-72, 1995-07-20
被引用文献数
2

人とコンピュータの円滑なインタフェース構築を目指して、コンピュータグラフィックスによる顔画像生成と、画像認識,音声対話を統合したシステムを試作した。画像認識部ではディスプレイの前の人物の頭部位置を検出し、検出結果を入力画像毎に対応付けることによって顔画像の視線の動きを自然なものにしている。音声対話部では対話の状態にあった入力手段を提供するなど、ユーザが適切な応答をすることができるサポートをすると同時に、顔画像の表情や動きを変化させることで対話システムの欠点を補っている。さらに、システムの機能を補間するという位置付けで、デスクトップTV会議システムと結合し、システムが対処できない状況では適宜専門化に補助を依頼することもできる。For the purpose of easing human computer interaction, we built a visitor guidance system integrating facial animation by computer graphics, image processing, and speech dialogue. Gaze directions of the facial animation are controlled by detecting head positions of the persons in front of the display and tracking the person who is regarded as the main target. The speech dialogue part gives a user appropriate answers by incorporating an extended plan reasoning method. By changing facial expressions and movements of the facial animation, we can show the states of the system to a user as nonverbal information to make up for the weakness of the speech dialogue such as inaccuracy of voice recognition. We integrated the desktop conference system into our multi-modal interaction system. It can decrease unsolved situations with the assistance of a human expert.