著者
北條 奈緒美 獅々堀 正幹 北 研二
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.108, no.408, pp.59-64, 2009-01-19
被引用文献数
1

近年,ユーザが入力した質問文に対して大量の知識源から回答を得る質問応答システムの研究が注目されている.特にインターネットの普及により,Googleに代表されるWWW検索エンジンを用いて,WWW空間から回答を探す技術が研究されている.これらのシステムでは,質問文内から抽出されたキーワードをWWW検索エンジンに入力し,その検索結果から回答を出力している.本稿では,質問文からキーワードを抽出する際に起こる,用語の過分割問題に着目し,WWW検索エンジンを用いた質問文内の用語特定手法を提案する.本手法は,学習フェーズおよび用語特定フェーズから構成される.まず学習フェーズでは,学習データの各用語候補に対して,WWW検索エンジンでの検索結果(サマリ)から継続度,品詞,文字種などの特徴量を抽出し,Support Vector Machine(SVM)を用いて用語判定モデルを作成する.次に,用語特定フェーズでも同様に特徴量を抽出した後,用語判定モデルを用いて用語を特定する.実際に,NTCIR4-QAC2の質問文に対して本手法で用語特定を行った結果,従来手法と比較して約55%の質問文に対して用語特定精度の向上が認められた.