著者
イアン レーン 河原 達也 松井 知子 中村 哲
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.103, no.518, pp.29-34, 2003-12-12

音声言語システムにおいては,バックエンドシステムが受理できない発話(ドメイン外発話)への対処が問題となる.本稿では,このようなドメイン外発話の検出法の枠組みを新たに提案する.本手法は,複数トピックの分類の信頼度を用いて,ドメイン内検証モデルをGPD(Generalized Probabilistic Descent)により学習する。この学習は,ドメイン内データの削除補間に基づいて行うため,ドメイン外の実データを必要とせず,移植性が高い.トピック分類手法として3つの手法(単語N-gram,LSA,SVM)を比較した結果,SVMが最も高い識別能力を得た.ドメイン外検出タスクにおいて,提案手法は,トピック分類結果の単純な組合せによるベースライン法と比較して,6.5ポイントも検出誤り率を改善した.さらに,実際のドメイン外データを用いて学習したシステムと比較しても,ドメイン外データを使用しない提案手法によりほぼ同等の性能が得られることがわかった.