著者
平藤 燎 牧田 光晴
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. SLP, 音声言語情報処理
巻号頁・発行日
vol.2015, no.7, pp.1-6, 2015-05-18

インターネット上のコミュニティサービスやソーシャルメディアのチャットログのような崩れた話し言葉テキストでは,形態素解析や固有表現抽出のような基礎的な処理が十分な精度で行えない.本研究ではこれらの基礎的タスクのうち,特に人名表現の抽出を従来より精度よく行う手法を提案する.まず会話のセッション内からヒューリスティクスを複数用いて人名表現候補を列挙する.これらを形態素解析時に辞書へ追加してから解析を行い,実際にその人名表現候補が選ばれた場合に人名表現と判定する.この方法により,既存の形態素解析器や固有表現抽出器では難しいあだ名や難読人名なども抽出できるようになり,Fisher's Randomization Test を用いた統計検定で 1% 水準で F-measure の改善が有意なことを確認した.