著者
水野 智士 高木 浩吉 小暮 悟 伊藤 敏彦 甲斐 充彦 小西 達裕 伊東 幸宏
出版者
情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.12, pp.77-82, 2005-02-05
被引用文献数
5

近年の音声認識、言語理解技術、及びコンピュータ性能の向上によって、音声を用いるインタフェースやタスク指向型の対話システムが利用されるようになってきた。そんな中で、より一般的にシステムが利用されるようになるには、より頑健な言語理解が必要となる。本稿では、より頑健な意味理解を実現するために、音声認識信頼と対話履歴を利用して、ユーザ発話意図の推定を行う手法について記述する。本研究では、言語理解の頑健さを向上させるために、対話履歴において、県名や市町村名など、どのカテゴリについての発話がされたのかを識別する。その識別結果と、認識結果のn-bestを利用して言語理解結果を生成する。これを実現する場合、カテゴリ識別の精度がそのまま言語理解精度に影響する。そこで、ユーザの発話意図を推定することで、カテゴリ識別精度の向上を図り言語理解精度向上を目指した。評価実験を行い、音声認識の1-bestをそのまま利用する言語理解手法よりも提案手法のほうが、言語理解精度が高くなることを示した。The spoken dialogue interface and the task oriented dialogue system has come to be used by improving the speech recognition, the language understanding technologies, and the computer performance. We need a more robust language understanding for the system to come to be used more generally. Our paper deals with speech intent presumption method using the confidence score of speech recognition and dialogue history for robust meaning understanding. This language understanding results are generated by using the speech recognition results (n-best) and the identification results. Thus, the accuracy of the category identification influences the language understanding accuracy. Then, we used the presumption of user's speech intention in order to improve the language understanding accuracy. As the result of evaluation experiment, we show that the language understanding performance used our proposed method is higher than the language understanding method which simply gives priority to the first hypothesis of a n-best.
著者
由浅 裕規 水野 智士 伊藤 敏彦 甲斐 充彦 小西 達裕 伊東 幸宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.103, no.519, pp.199-204, 2003-12-11
被引用文献数
1

本稿では,状況及び文脈を利用した言語理解手法をもつ音声対話システムの構築と,その有効性を示すための評価実験について述べる.システムに対する発話方法を「対象を操作」,又は嘱性は値」という文体に制限することで認識率の向上を図り,また一入力だけでなく連続的に複数の入力を一発話で行えるようにシステムを構築した.タスクとしてはエアコン・カーステレオの操作を想定し,その音声インタフェースという具体的な状況設定において,被験者20名による評価実験を行った.対話の分析を行うことによって,状況及び文脈を利用した言語理解の有効性,制限された発話方法における言語的な特徴や複数設定発話に関するユーザ意識など,様々な知見を得ることができた.