- 著者
-
那須川 哲哉
金山 博
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
- 巻号頁・発行日
- vol.2004, no.73, pp.109-116, 2004-07-16
- 参考文献数
- 15
- 被引用文献数
-
12
5
組織・製品などに関して好不評を示す表現,及びそれが好評を示すか不評を示すかの極性を,文書データから教師なし学習で獲得する手法を示す.ある対象に関して評価を述べる内容を記述する際には,好評もしくは不評の意見を列挙することが多く,好不評の極性を反転させる際には「けれども」「しかし」といった接続表現で明示することが多い.本手法では,この『評価表現の文脈一貫性』を利用し,「満足する」「不満だ」などの種表現の周辺文脈から評価表現の候補とその極性を抽出し,各候補の文書データ全体における分布から評価表現としての妥当性を判定する.得られた評価表現を種表現に追加する操作を再帰的に実行することで,好不評の極性付きの語彙を,少数の種表現から自動構築することが可能になる.デジタルカメラと映画に関する掲示板のデータで実験したところ,各々の分野に特徴的な評価表現を高い精度で抽出することができた.This paper presents an unsupervised learning method to acquire sentiment expressions that indicate either favorable or unfavorable opinion toward a specific subject. Our approach is based on a characteristic of sentiments that multiple sentiment expressions often appear near each other in texts with the same polarity of favorability, unless the change is explicitly indicated by a clue term such as an adversative conjunction. By taking advantage of this characteristic, our unsupervised method extracts sentiment expressions and their polarities from a corpus starting from a very small set of seed expressions and analyzing their neighboring expressions in the corpus. In our experiment on discussion board messages about digital cameras and movies, we could acquire a good set of sentiment expressions relevant to each domain.