著者
堂前友貴 関洋平
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. 情報学基礎研究会報告
巻号頁・発行日
vol.2013, no.8, pp.1-6, 2013-07-15

本研究では,ツイート中のトピックには,地域に偏りがあるものと,共通で現れるものがあるという仮定のもと,トピックを利用し,Twitter ユーザの生活に関わる地域を推定する手法を提案する.まず,訓練データとして,ロケーション項目に地域名を記述しているユーザのツイートを使用し,LDA を用いて地域ごとにトピックを作成する.次に,各トピックを比較し,地域に偏りのあるトピックに地域ラベルを付与する.そして,地域ラベルが付与されたトピックに対応するツイートを使用し,ツイートをトピックに分類する.各ユーザの生活に関わる地域は,ユーザのツイートに割り当てられたトピックに対して,付与された地域ラベルに基づき推定する.都道府県を,生活にかかわる地域の単位とし,16 の都道府県を対象として,ユーザの生活に関わる地域の推定実験を行ったところ,精度 0.59,再現率 0.54,F 値 0.56 となった.
著者
堂前 友貴 関 洋平
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.7, no.3, pp.1-13, 2014-09-26

Twitterにおいて,ユーザの生活に関わる地域は,社会行動の分析において重要な属性の1つであるが,プロファイルに明示的に記述されていることは少ない.本研究では,Twitterユーザを対象として,半教師ありトピックモデルを利用した地域特徴語の選択に基づく,生活に関わる地域属性の推定手法を提案する.本研究では,半教師ありトピックモデルにより地域に特徴的な語を選択する.具体的には,地域情報サイトから収集した地域特徴語を含むツイートを教師データとした,半教師ありトピックモデルにより,地域に特徴的なトピックを抽出する.そして,トピックから選定した地域特徴語を使用し,ツイートごとに地域ラベルを付与する.各ユーザの生活に関わる地域は,ユーザのツイートに割り当てられた地域ラベルに基づき推定する.提案手法に基づき,都道府県を,生活に関わる地域の単位とし,16の都道府県を対象として,ユーザの生活に関わる地域の推定実験を行ったところ,精度0.65,再現率0.67,F値0.66の評価値が得られた.