- 著者
-
大野 邦夫
渡辺 篤史
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会研究報告電子化知的財産・社会基盤(EIP) (ISSN:09196072)
- 巻号頁・発行日
- vol.2008, no.10, pp.47-54, 2008-01-31
本報告は、SNSを代表とするソーシャルメディアから、テキストマイニングを用いて情報を抽出する手法の技術的可能性を検討するものである。テキストマイニングツール、TRUSTIAを用いてmixiのコミュニティの情報から趣味に関する情報を頻度分布として取り出し、それを用いてデータを抽出し、各種コミュニティを相対的に比較した。さらにmixiがサポートしているカテゴリ毎のコミュニティ情報検索機能を用いて、趣味情報の分布を求め、テキストマイニングによる結果との比較を行ない、SNSに対するテキストマイニングの適用領域を考察した。The goal of this paper is to study the possibility of text mining technology to acquire the information through social media as SNS. A macro program that extracts mixi community information to text mining tool TRUSTIA has been developed. Vocabularies related to personal hobby of various community have been evaluated through TRUSTIA and statistically compared through histogram. Besides, relationship of hobby vocabulary distribution to community category has been calculated through built-in retrieval function of mixi community, and compared to the text mining result.