著者
瀧口裕一 大石哲也 長谷川隆三 藤田博 越村三幸 倉門浩二
出版者
一般社団法人情報処理学会
雑誌
全国大会講演論文集
巻号頁・発行日
vol.2011, no.1, pp.567-569, 2011-03-02

本研究では、Wikipediaの単語(記事)のアクセス数解析に基づいた単語、もしくはカテゴリ間にある関連度を算出し、関連度の高い単語、カテゴリを抽出する方法について提案する。Wikipediaの単語(記事)単位で1時間毎に集計されたアクセス数を基に回帰分析や単語毎にアクセス数が急激に増えた(以下バーストと呼ぶ)期間を検出する方法を用いて、ある単語との関連度の高い単語をWikipedia内の全単語と、その単語内に記載されているリンク先の単語からそれぞれ抽出する。また、Wikipediaの全カテゴリについても単語と同様の方法を用いて、あるカテゴリと関連度の高いカテゴリを抽出する。
著者
倉門 浩二 大石 哲也 長谷川 隆三 藤田 博 越村 三幸
雑誌
研究報告データベースシステム(DBS)
巻号頁・発行日
vol.2010-DBS-150, no.12, pp.1-8, 2010-07-28

近年,インターネットの普及に伴って,膨大な文書を閲覧することが可能となり,適切な文書を探すために検索エンジンを利用する機会が多くなっている.しかし,検索エンジンを利用しても,求める情報を得ることが難しい場合も多い.本研究は,Wikipedia のリンク情報やカテゴリ構造を解析することで,検索クエリの関連語を抽出し,検索結果の適切なリランキングを行うことを目的としている.