著者
小川 拓貴 松本 和幸 任 福継
出版者
情報処理学会
雑誌
研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.2, pp.1-6, 2010-01-21
参考文献数
12
被引用文献数
1

本研究では,Webサービス"えもにゅ"の投稿文をコーパスとして用い, 単語1-gramを素性としたSVMによるつぶやきや一言を対象とした感情推定手法を提案する."えもにゅ"とは一言メモに感情マークを付加して投稿できるWebサービスで, この投稿文をコーパスとして用いることで書き手の感情をコーパスに直接反映でき, また感情タグ付け作業を削減できる. 単語1-gramを素性とした理由としては, つぶやきや一言のような短文において書き手が感情表現する際に単語や記号の言語的意味を用いて感情を表現することが多いと考えられる事,1文あたりに含まれる素性の数が少ないつぶやきや一言から十分な素性の出現頻度を得るためには素性数を抑えることで1素性あたりの出現頻度を上げる必要がある事が挙げられる. 評価実験として, 単語1-gramを素性とした場合と単語2-gramを素性とした場合で比較をしたところ, F値を評価基準とすると単語1-gramを素性とした場合の方が全ての感情において高い値を示した.This paper proposes a SVM-based emotion estimation method from a short message or a word by using word 1-gram as feature and use contribution of "Emonyu" as a corpus. "Emonyu" is a web service to which users contribute a short message or a word with a emotion mark.Therefore, the corpus using"Emonyu"contribution enables reflect writer's emotion directly,and reduce work of adding emotion tags to sentences of corpus. We use word 1-gram as feature is,in short sentences like a short message or a word including a few features,a writer generally express emotion using a linguistic meaning of a word or a mark and it is necessary to reduce a number of kinds of feature to get exact appear frequency of features. The result of experiments show that the F-measure of proposed method is higher than the F-measure of method using word 2-gram as a feature in all emotions.