- 著者
-
瀧口裕一
大石哲也
長谷川隆三
藤田博
越村三幸
倉門浩二
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 全国大会講演論文集
- 巻号頁・発行日
- vol.2011, no.1, pp.567-569, 2011-03-02
本研究では、Wikipediaの単語(記事)のアクセス数解析に基づいた単語、もしくはカテゴリ間にある関連度を算出し、関連度の高い単語、カテゴリを抽出する方法について提案する。Wikipediaの単語(記事)単位で1時間毎に集計されたアクセス数を基に回帰分析や単語毎にアクセス数が急激に増えた(以下バーストと呼ぶ)期間を検出する方法を用いて、ある単語との関連度の高い単語をWikipedia内の全単語と、その単語内に記載されているリンク先の単語からそれぞれ抽出する。また、Wikipediaの全カテゴリについても単語と同様の方法を用いて、あるカテゴリと関連度の高いカテゴリを抽出する。