- 著者
-
堂前 友貴
関 洋平
- 雑誌
- 情報処理学会論文誌データベース(TOD) (ISSN:18827799)
- 巻号頁・発行日
- vol.7, no.3, pp.1-13, 2014-09-26
Twitterにおいて,ユーザの生活に関わる地域は,社会行動の分析において重要な属性の1つであるが,プロファイルに明示的に記述されていることは少ない.本研究では,Twitterユーザを対象として,半教師ありトピックモデルを利用した地域特徴語の選択に基づく,生活に関わる地域属性の推定手法を提案する.本研究では,半教師ありトピックモデルにより地域に特徴的な語を選択する.具体的には,地域情報サイトから収集した地域特徴語を含むツイートを教師データとした,半教師ありトピックモデルにより,地域に特徴的なトピックを抽出する.そして,トピックから選定した地域特徴語を使用し,ツイートごとに地域ラベルを付与する.各ユーザの生活に関わる地域は,ユーザのツイートに割り当てられた地域ラベルに基づき推定する.提案手法に基づき,都道府県を,生活に関わる地域の単位とし,16の都道府県を対象として,ユーザの生活に関わる地域の推定実験を行ったところ,精度0.65,再現率0.67,F値0.66の評価値が得られた.