著者
蔵内 雄貴 内山 俊郎 内山 匡
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J96-D, no.6, pp.1503-1512, 2013-06-01

Twitterは,毎日3億を超える投稿がある.この投稿の収集や解析が可能なことから,Twitterはマーケティングのための情報源として注目されている.年齢,性別,居住地域といったユーザ属性が得られれば,各属性をもつユーザにターゲットを絞って投稿内容を解析できる.しかし,属性を公開していないユーザも多く,投稿内容からの属性推定が研究されているが,精度は十分でない.そこで,ソーシャルグラフにおける近隣ユーザ同士の属性が近いという性質を利用し,これらを組み合わせることによって精度向上を目指す.本論文では,マルコフ確率場を用いてソーシャルグラフ上のユーザ属性をモデル化し,最適化問題として真の属性を推定する手法を提案する.実験では,サイコグラフィック属性とデモグラフィック属性の推定実験を行った.サイコグラフィック属性の推定では,人工的に付加したノイズを54%除去でき,デモグラフィック属性の推定では,地域属性の推定精度が9.1%ポイント改善するなど,提案法の有効性を確認した.