- 著者
-
磯野 史弥
松吉 俊
福本 文代
- 雑誌
- 研究報告自然言語処理(NL)
- 巻号頁・発行日
- vol.2013-NL-213, no.7, pp.1-8, 2013-09-05
本研究では,Web 掲示板に存在する皮肉や誹謗中傷などの不適切な表現を自動的に検出する手法を提案する.我々は,Web 掲示板における皮肉を人手で体系的に分類し,8 つの分類クラス (疑問,推測,諦め,不相応,誇張,驚き,形容,対比) を構築した.それぞれの分類クラスに対して,対象の文とその前後文の評価極性を考慮する構文パターンを設計した.提案する皮肉検出システムは,構文パターンの集合を利用することにより,入力された文が皮肉文であるかどうかを判定する.提案する誹謗中傷検出システムは,Support Vector Machine (SVM) を用いて,入力された文が誹謗中傷文であるかどうかを判定する.ここでは,素性として,独自に構築した辞書に存在する誹謗中傷語の出現頻度と,対象の文とその前後文の評価極性を利用した.評価実験の結果,提案するシステムは,F 値においてベースラインを上回った.