著者
関洋平
雑誌
研究報告情報基礎とアクセス技術(IFAT)
巻号頁・発行日
vol.2012, no.2, pp.1-8, 2012-09-18

インターネット, Web を利用した電子メディアの発展とともに,ユーザ個人が発信する意見の影響は大きくなり,その利用方法は変遷し続けている.電子的に蓄積された意見情報を分析することにより,消費活動や行動判断に有用な情報へのアクセスを支援する研究として,主に自然言語処理,情報検索,データ工学などの分野で,意見分析あるいは意見マイニングの研究が行われている.意見を分析するための表層的な特徴は,文書ジャンルあるいはメディアごとに異なることが知られており,ニュース,レビュー,ブログ,マイクロブログなど,様々なメディアごとにコーパスが重要な役割を果たす.本稿では,意見分析についての最近の研究におけるコーパスの使用状況を明らかにするとともに,意見分析コーパスの代表的な事例について紹介する.
著者
堂前友貴 関洋平
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. 情報学基礎研究会報告
巻号頁・発行日
vol.2013, no.8, pp.1-6, 2013-07-15

本研究では,ツイート中のトピックには,地域に偏りがあるものと,共通で現れるものがあるという仮定のもと,トピックを利用し,Twitter ユーザの生活に関わる地域を推定する手法を提案する.まず,訓練データとして,ロケーション項目に地域名を記述しているユーザのツイートを使用し,LDA を用いて地域ごとにトピックを作成する.次に,各トピックを比較し,地域に偏りのあるトピックに地域ラベルを付与する.そして,地域ラベルが付与されたトピックに対応するツイートを使用し,ツイートをトピックに分類する.各ユーザの生活に関わる地域は,ユーザのツイートに割り当てられたトピックに対して,付与された地域ラベルに基づき推定する.都道府県を,生活にかかわる地域の単位とし,16 の都道府県を対象として,ユーザの生活に関わる地域の推定実験を行ったところ,精度 0.59,再現率 0.54,F 値 0.56 となった.