- 著者
-
落合 桂一
山田 渉
深澤 佑介
菊地 悠
松尾 豊
- 雑誌
- 情報処理学会論文誌データベース(TOD) (ISSN:18827799)
- 巻号頁・発行日
- vol.9, no.2, pp.11-22, 2016-06-29
本研究では,Twitterの投稿文章とプロフィール情報から生成した特徴量に基づき,機械学習によりPoint-of-Interest(POI)の公式アカウントを判定する方法を提案する.公式アカウントを判定するため,あらかじめ用意したPOIデータベースを使いPOI名称とTwitterのユーザ名を比較する方法では,1)POIデータベースにないPOIは抽出されないという課題,2)POI名称が正式名称のために通称や略称などが使われるユーザ名と一致しないという課題,3)一般ユーザがユーザ名にPOI名称を利用している場合があるという課題がある.そこで,Twitterの投稿内容やプロフィール情報に基づいてPOI公式アカウントを判定する手法を提案する.本研究では,POI公式アカウント抽出のための特徴量として,従来用いられていた投稿文章や自己紹介文のBag-of-Wordsに加え,POI固有特徴量(場所情報,営業時間,連絡先など),知名度に関する特徴量(フォロワ数やリストに登録されている数など),プロフィール画像の画像特徴量を提案する.実験によりPOIデータベースを利用した場合と比較し,約3倍のPOI公式アカウントが抽出可能であることを示した.また,提案した特徴量を利用した場合,従来手法の特徴量を利用した場合と比較し分類性能を表す再現率0.933,F値0.938で最大になることを示した.