著者
西村 駿人 数原 良彦 鷲崎 誠司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.112, no.367, pp.23-27, 2012-12-12

本研究では,Twitterユーザのプロフィールに記述されている居住地とユーザが投稿したツイートに出現する単語情報をもとに地域特徴語の選択手法を提案する.またTwitterユーザの居住地をラベル,ユーザが投稿した単語情報を素性とすることでマルチクラス分類を用いてユーザの居住地の推定を行う.日本語Twitterデータに対して評価実験を行い,提案手法が地域特徴語選択を行わないベースライン手法に比べて高い正解率で推定することを確認した.