著者
安村 禎明 坂野 大作 上原 邦昭
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.14, no.3, pp.297-313, 2007-04-10 (Released:2011-03-01)
参考文献数
11

本論文では, Web上の評判情報を有益に活用するために, レビューなどの評価文書をポジティブ (おすすめ) とネガティブ (おすすめしない) という極性値に分類する手法を提案する. 本手法では, 全体評判情報と部分評判情報という2つのレベルで評判情報を捉える. 全体評判情報とは評価文書の対象全般に関わる評価表現のことを指し, 部分評判情報とは対象の一属性に関する評価表現のことを指す. 全体評判情報の極性値は評価文書の極性値と一致すると考えられるため, まず全体評判情報を用いて評価文書を分類し, 全体評判情報がない場合は部分評判情報を用いて分類する. これら2つのレベルの評判情報を考慮することで分類精度の向上が期待できる. さらに, これら2つのレベルの評判情報を用いることで, 評判情報の信頼性評価の一手法を提案する. ここでは, 評価文書の極性値とその中の部分評判情報の極性値が異なる場合にその部分評判情報は信頼性が高いと評価する. 映画のレビューを用いた評価実験の結果, ナイーブベイズを用いた分類手法よりも本手法の方が良い結果が得られた. また, 提案した評価指標が評価文書の信頼性評価の1つとなりうることを示唆した.