著者
伊藤 慶明 木山 次郎 関 進 小島 浩 張建新 岡 隆一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.1995, no.73, pp.17-22, 1995-07-20
参考文献数
17
被引用文献数
18

本稿では、人間と計算機の新しい対話形態,インタフェース・システムの提案を行う。本システムでは、マルチユーザによる音声とジェスチャのマルチモーダルな入力が可能で、これらの認識技術を統合することによって音声とジェスチャの同時かつ相補的な理解を実現する。さらに、システムの理解内容を合成音声と画像を通してリアルタイムにかつ漸次的にユーザにフィードバックすることによって、複数の人間と計算機との知的で、かつ豊かなコミュニケーションを実現する。本方式は、一種の思考の支援と考えることもでき、これを次世代のインタフェースと位置付ける。我々は、このインタフェースを実現するために、frame?wise and realtime spotting技術を用いて、複数話者による音声とジェスチャの同時認識/理解リアルタイム統合インタフェースシステムを試作した。This paper proposes a new type of dialog system, or interface system between men and computers. This system allows multi-modal input of speech and gesture by multiple users, and enables simultaneous and complimentary understanding for speech and gesture by integrating both recognition technologies. It realizes intellectual and affluent communication between multiple users and computers by real-time and gradual feedback of understanding state in the system, using synthesis speech and graphics image. The system can be thought as a novel interface system as it gives users a sense of reality and unity. We realized such a real-time interface system that integrates speech understanding and gesture understanding by multiple users.
著者
木山 次郎 伊藤 慶明 岡 隆一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.95, no.123, pp.81-88, 1995-06-23
被引用文献数
22

蓄積された任意話題の音声から重要な単語を取り出したり、話題の境界を検出することができれば有用であろう。本稿では、音声中の互いに類似した十分な長さの区間を抽出することによって重要区間抽出を実現する手法を提案する。この方式は、任意の話題について詳細な要約が可能という利点を持つ。1名の話者の発声した模擬対話音声を対象に実験を行ない、本方式の有効性を確認した。また、本稿では、互いに類似する区間の対応関係を利用した、話題境界の抽出法を提案する。1名の話者が発声する4話題の模擬対話を接続した音声を用いた実験により、本手法が有効であることを確認した。さらに、本稿では、長時間の音声中の類似区間を抽出するのに適した手法として、Incremental Reference Interval-free Continuous Dynamic Programming(IRIFCDP)を提案する。