著者
若山龍太 白井清昭
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2014-NL-216, no.21, pp.1-8, 2014-05-15

質問タイプの分類はファクトイド型質問応答システムにおける重要な要素技術である.従来手法では,あらかじめ定義されている質問タイプの粒度が粗いため,実用的な質問応答システムに用いるには不十分であるという問題があった.本研究では,関根の拡張固有表現階層に基づく詳細な質問タイプを定義し,質問文の質問タイプを Support Vector Machine (SVM) ならびに k-NN 法を用いて自動分類することを試みる.また,分類器の訓練データとして,正解の質問タイプが付与された質問文のコーパスに加えて,固有表現タグ付きコーパスを併用する手法を提案する.実験の結果,質問タイプ分類の正解率は 60.3%となった.学習素性の有効性を検証した結果,自立語,疑問詞の素性が質問タイプの分類に有効であること,訓練データの量が多いときには単語 bi-gram も有効な素性であることがわかった.一方,訓練データとして固有表現タグ付きコーパスを併用することの効果は確認できなかった.
著者
若山龍太 白井清昭
出版者
一般社団法人情報処理学会
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2014, no.21, pp.1-8, 2014-05-15

質問タイプの分類はファクトイド型質問応答システムにおける重要な要素技術である.従来手法では,あらかじめ定義されている質問タイプの粒度が粗いため,実用的な質問応答システムに用いるには不十分であるという問題があった.本研究では,関根の拡張固有表現階層に基づく詳細な質問タイプを定義し,質問文の質問タイプを Support Vector Machine (SVM) ならびに k-NN 法を用いて自動分類することを試みる.また,分類器の訓練データとして,正解の質問タイプが付与された質問文のコーパスに加えて,固有表現タグ付きコーパスを併用する手法を提案する.実験の結果,質問タイプ分類の正解率は 60.3%となった.学習素性の有効性を検証した結果,自立語,疑問詞の素性が質問タイプの分類に有効であること,訓練データの量が多いときには単語 bi-gram も有効な素性であることがわかった.一方,訓練データとして固有表現タグ付きコーパスを併用することの効果は確認できなかった.