- 著者
-
但馬 康宏
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
- 巻号頁・発行日
- vol.2013, no.18, pp.1-6, 2013-09-19
Twitter や Facebook に代表される他のウェブサービスとの関連が手軽にできる API を備えたソーシャルコミュニケーションツールによって,ウェブページに対する利用者からのコメントを容易に収集できるようになった.これらのコメントは短いが,その人の感覚的な意見であることが多いため,その分類,分析手法はテキストマイニングにおいて重要である.本研究では,ウェブのニュース記事に対して付けられた読者のコメントについて,その書き手がどのような感情を持って書き込んでいるかを自動分類する手法を提案し,その性能評価を行う.第一の手法は,単純なナイーブベイズによる分類であり,分類対象を形態素に分けた後に感情を表す確率変数の分布を求めることにより推定を行う.第二に,推定先の感情を 「悲しみ」 と 「喜び」 など対を成すものに分類し,その対の出現率で重みを付けた手法で推定を行う.第三に,そのような対となる感情の出現率で一度推定を行い,その後,対となっている感情のどちらであるかを推定する二段階の推定を行う.その結果,単純なナイーブベイズの適用よりも,対となる感情をもとに重み付けを行った後に分類を行う手法が高性能であることが明らかとなった.We propose emotion estimation methods for multilabeled short comments of web news sites. Our methods can be applied to sentiment analysis and opinion mining. At first, we show the perfomance evaluation of a Naive Bayes classifier. Then, we propose two improved methods which forcused on opposite emotions. The first improved method classifies each emotion label into two opposite emotions and uses their weights. We call this the weighting method. The second method consists of two stages of classifiers. The first stage distinguishes these oppositely classes, and the second stage selects one emotion from the opposite emotions. From our evaluation, we conclude that the weighting method is better than the simple Naive Bayes method.