著者
藤井雄太郎 安藤哲志 伊藤孝行
雑誌
第73回全国大会講演論文集
巻号頁・発行日
vol.2011, no.1, pp.397-398, 2011-03-02

近年,ソーシャル・ネットワーキング・サービス(SNS)やブログ等では,未成年にとって悪影響を及ぼすような書き込みや画像,または動画などの存在が問題となっている.そのため,効率的かつ自動的に有害な情報を適切に判別し,人への負担を軽減するための研究が進められている .本稿では,掲示板等の文章に注目し有害な情報の判別を行う.文章中の複数単語間の共起情報、距離情報に加え、グレイワードという概念を定義し、それらを用いた有害文書分類手法を提案する.また,今回判別する文章の対象として,過度な性的描写を含む文章とする.
著者
安藤哲志 藤井雄太郎 川口将吾 伊藤孝行
雑誌
第73回全国大会講演論文集
巻号頁・発行日
vol.2011, no.1, pp.347-348, 2011-03-02

近年,掲示板やブログといったユーザーが自由に投稿できるWebサイトが増加している.ユーザーが自由に投稿可能なWebサイトでは,未成年に有害な投稿がされることがあり問題となっている.多くのWebサイトでは,有害な記事が投稿されたのちに,人手の確認によって対応を行っている.しかし,人手による対応では運営コストが大きくなってしまう問題がある.本稿では,有害な投稿記事を自動的に判定する手法の提案を行う.本稿での提案手法は,有害な文書である負例と有害では無い文書である正例から,共起情報を抽出した辞書を作成し,判定に用いる.