著者
池田 和史 服部 元 松本 一則 小野 智弘 東野 輝夫
出版者
情報処理学会
雑誌
情報処理学会論文誌コンシューマ・デバイス&システム(CDS) (ISSN:21865728)
巻号頁・発行日
vol.2, no.1, pp.82-93, 2012-03-21
被引用文献数
1

近年,TwitterのようなブログやWeb掲示板などに投稿された商品やテレビ番組などに対する口コミ情報を分析してマーケティングなどに応用する評判解析技術に注目が集まっている.これらは手軽に情報発信することが可能なため,新鮮かつ多数の意見を即座に収集するツールとして,その活用は大きな可能性を持っている.一方で,評判は投稿者の年齢や性別,趣味などのプロフィールに応じて異なることが多いが,ブログや掲示板には投稿者の年齢や性別が記載されていない場合が多く,投稿数や平均的な意見などの表面的な情報しか抽出できず,プロフィールごとの意見を抽出できないことが課題であった.この問題を解決するため,著者らはTwitter上の口コミ投稿者の日常的な投稿内容を解析することで,年代,性別,居住地域などのプロフィールを推定する技術を開発した.本技術を利用することで,ネット上の口コミ情報をプロフィールごとに分類,集約することが可能となり,商品の改善やテレビ番組の企画などに生かすことが可能となる.性能評価実験の結果,提案手法の汎用的な推定精度は性別で88.0%,年代で68.0%,居住地域で70.8%であり,視聴率測定などへの応用を想定したプロフィール分布誤差の評価では,分布に偏りがある場合でも性別で8.8%,年代で12.4%,居住地で14.0%と実利用に十分な精度であることが示された.This paper proposes a real-time analysis technology of the online opinions of commercial products and broadcast TV programs. As many people submit their opinions via social media services, such as Twitter, utilizing these real-time and huge amounts of opinions is strongly desired as a novel marketing tool. However, it is impossible in many cases to understand the overall trend of such enormous user opinions by browsing the information stream on the screen. In addition, though presuming the ratio of positive and negative opinions is useful, that discrimination is not much enough because the ratio of opinions differs depending on user demographics (age, sex, area, etc.) The proposed technology makes it possible to analyze the contents of Twitter streams related to commercial products or broadcast TV programs, and estimate the demographics of the users by tracking and analyzing their past tweets. This analysis attracts peoples such as, product planners, broadcast TV directors, and advertisement agencies that produce and promote products/TV programs for target segments. Our experimental results show that the estimation accuracy of the proposed algorithms is, 88.0% in sex, 68.0% in age, 70.8% in areas, respectively. The error ratio in the distribution of estimated demographics was 8.8% in sex, 12.4% in age, 14.0% in area, respectively, which is high enough for practical use.

言及状況

はてなブックマーク (1 users, 1 posts)

[tech][data][データマイニング]

収集済み URL リスト