- 著者
-
西原 陽子
- 出版者
- 立命館大学
- 雑誌
- 若手研究(B)
- 巻号頁・発行日
- 2017-04-01
本研究の目的は、ネットいじめに関わる不適切な表現を自動判定する方法を構築し、ネットいじめを減少させることである。本年度は以下の2点を実施した。1点目は、ネット上のいじめに関わる不適切な表現を収集したことである。2点目は、不適切な表現の言語特徴を明らかにし、不適切な表現を自動判定するための言語モデルを作成したことである。1点目の実施の詳細を述べる。ネット上のいじめに関わる不適切な表現が掲載されることが多いWebサイトから、掲載されている文を自動収集するプログラムを作成し、収集を行なった。その後、人手により不適切な表現が含まれる文と、それ以外に分類した。さらに、不適切な表現が含まれる文については4種類に分類した。2点目の実施の詳細を述べる。全ての文に対してその種類を表すラベルを付与した。具体的には不適切な文の4種類に対してと、不適切な表現が含まれない文に対してラベルを付与した。ラベルの系列をLong Short Term Memoryにて学習し、言語モデルを作成した。これにより、文を構成する単語の情報と、文書を構成する文の並びの情報の両方から、次にくる文が不適切な表現を含む文か否かが評価可能となった。今年度の成果の意義は、不適切な表現を含む言語モデルを作成したことにより、隠語や造語を含む不適切な表現の文も判定できるようになったことである。今年度の成果の重要性は、文脈を考慮したことによりある文脈では不適切表現であっても、別の文脈では不適切表現とならないものを判定できる可能性が生まれたことである。