- 著者
-
森田 一
高村 大也
奥村 学
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
- 巻号頁・発行日
- vol.111, no.119, pp.89-93, 2011-06-30
本研究はblog等のWeb上のテキストから.製品等についての評価表現を対象語,属性語,評価語の三つ組として抽出することを目的としている。この三つ組抽出を,文に対する系列タギング問題の一種として解くことで,一語に限らない多様な表現の抽出を行う。評価表現では対象語とその属性語が評価語と強く関連しているため.対象・属性語と評価語の結びつきの強さを含めて学習を行う枠組みを提案する。このため,本研究では構造学習の枠組みを用いて文に対するラベル系列を学習する.文とラベルに対して素性ベクトルを定義し,文とラベルをモデルで評価したスコアを最大化するように,Viterbiアルゴリズムを元にしたアルゴリズムでラベルを探索する.学習にはオンライン学習アルゴリズムのPassive Aggressive Algorithmを用い,正しいラベル系列が探索空間中でスコアが高くなるよう,モデルを更新することで行う.Web文書に対して評価表現の三つ組がタグ付けされたコーパスを用いて,提案手法の実験を行った結果を元に,手法の問題点とその解決策についての考察を行う.