著者
磯野 史弥 松吉 俊 福本 文代
出版者
一般社団法人情報処理学会
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2013, no.7, pp.1-8, 2013-09-05

本研究では,Web 掲示板に存在する皮肉や誹謗中傷などの不適切な表現を自動的に検出する手法を提案する.我々は,Web 掲示板における皮肉を人手で体系的に分類し,8 つの分類クラス (疑問,推測,諦め,不相応,誇張,驚き,形容,対比) を構築した.それぞれの分類クラスに対して,対象の文とその前後文の評価極性を考慮する構文パターンを設計した.提案する皮肉検出システムは,構文パターンの集合を利用することにより,入力された文が皮肉文であるかどうかを判定する.提案する誹謗中傷検出システムは,Support Vector Machine (SVM) を用いて,入力された文が誹謗中傷文であるかどうかを判定する.ここでは,素性として,独自に構築した辞書に存在する誹謗中傷語の出現頻度と,対象の文とその前後文の評価極性を利用した.評価実験の結果,提案するシステムは,F 値においてベースラインを上回った.We propose two detection systems that identify sarcasm and slander in posts on bulletin board system (BBS). We made a corpus of sarcasm in BBS, and classified sarcasm instances into eight classes: interrogative, guess, give-up, unbalance, exaggeration, shock, metaphor, and contrast. For each sarcasm class, we constructed syntactic patterns for detection of sarcasm that include sentence structures and polarity conditions of the target sentence, the previous sentence and the next sentence. Our first system detects sarcasm using a database of the syntactic patterns. We made a corpus of slander in BBS and a list of slander expressions extracted from the corpus. Our second system detects slander using Support Vector Machine (SVM), where as features, we use frequencies of words in the list, and positive expressions and negative expressions in the target sentence, the previous sentence and the next sentence. In the experiment, the proposed systems can achieve superior F-measures compared with baseline systems.
著者
磯野 史弥 松吉 俊 福本 文代
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2013-NL-213, no.7, pp.1-8, 2013-09-05

本研究では,Web 掲示板に存在する皮肉や誹謗中傷などの不適切な表現を自動的に検出する手法を提案する.我々は,Web 掲示板における皮肉を人手で体系的に分類し,8 つの分類クラス (疑問,推測,諦め,不相応,誇張,驚き,形容,対比) を構築した.それぞれの分類クラスに対して,対象の文とその前後文の評価極性を考慮する構文パターンを設計した.提案する皮肉検出システムは,構文パターンの集合を利用することにより,入力された文が皮肉文であるかどうかを判定する.提案する誹謗中傷検出システムは,Support Vector Machine (SVM) を用いて,入力された文が誹謗中傷文であるかどうかを判定する.ここでは,素性として,独自に構築した辞書に存在する誹謗中傷語の出現頻度と,対象の文とその前後文の評価極性を利用した.評価実験の結果,提案するシステムは,F 値においてベースラインを上回った.