著者
大久保雅且 杉崎 正之 井上 孝史 田中 一男
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.39, no.7, pp.2250-2258, 1998-07-15
被引用文献数
25

WWW (World Wide Web)検索サービスで使用された検索語から情報ニーズを抽出できれば,より効果的な情報収集や情報提供が可能になる.しかし,同じ概念を表す情報を求める際でも,それぞれの利用者の持つ固有の視点から様々な検索語が用いられる.このため,使用された検索語を単純に集計するのではなく,その時期に「同義語として用いられた」検索語を判定して集約しなければ,情報ニーズの本当の強さや傾向を求めることはできない.本論文では,使用された検索語の間に関連度を定義し,その値によって関連する検索語をグループ化する手法を提案する.関連度は,(1)検索要求の時間間隔から同一情報への要求かどうかを判定する方法と,(2)各検索語の使用頻度の時系列を求めそれらの間の相関関係を用いる方法,の2つの観点から定義する.また,一定の期間ごとにこれらの関連度を求めることによって,「その期間における同義語」をタイムリーにグループ化する.さらに,本手法を実際のWWW検索サービスのアクセスログに適用し,各情報ニーズの真の強さや傾向を把握できるだけでなく,関連語の提示によって要求解釈の支援が可能となることを示した.This paper proposes a method for detecting the information demands of a large group of people by analyzing the keywords used on a WWW (World Wide Web) search service.In general,a variety of keywords are used to retrieve information on the same topic.These keywords differ according to each user's viewpoint.Therefore,they,that is related words in a sense,must be gathered and summed up to extract information needs accurately.In this paper,relationships between two keywords are measured by time interval between them,and by the correlation coefficient of the number of uses per day.By calculating these relationships once in a certain period of time,for example one week,and by combining them effectively,keywords for the same topic can be grouped together.We applied the proposed method to the access log for an actual WWW search service,and found that it was useful for interpreting each request as well as for understanding the true strength and trends of information demands.