著者
王 駿キ 佐藤 栄一 延原 肇
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.28, 2014

本稿では、データ圧縮技術をテキスト分類に使用することによりテキストの言語に依存しない話題分類を実現し、短文投稿サイトTwitterに投稿されている複数の言語のTweetの分類を行う。また、圧縮の代わりにTweet文字列のエントロピーを用いた場合についても評価し、それぞれの手法の分類精度の比較を行った。