著者
大久保雅且 杉崎 正之 井上 孝史 田中 一男
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.39, no.7, pp.2250-2258, 1998-07-15
被引用文献数
25

WWW (World Wide Web)検索サービスで使用された検索語から情報ニーズを抽出できれば,より効果的な情報収集や情報提供が可能になる.しかし,同じ概念を表す情報を求める際でも,それぞれの利用者の持つ固有の視点から様々な検索語が用いられる.このため,使用された検索語を単純に集計するのではなく,その時期に「同義語として用いられた」検索語を判定して集約しなければ,情報ニーズの本当の強さや傾向を求めることはできない.本論文では,使用された検索語の間に関連度を定義し,その値によって関連する検索語をグループ化する手法を提案する.関連度は,(1)検索要求の時間間隔から同一情報への要求かどうかを判定する方法と,(2)各検索語の使用頻度の時系列を求めそれらの間の相関関係を用いる方法,の2つの観点から定義する.また,一定の期間ごとにこれらの関連度を求めることによって,「その期間における同義語」をタイムリーにグループ化する.さらに,本手法を実際のWWW検索サービスのアクセスログに適用し,各情報ニーズの真の強さや傾向を把握できるだけでなく,関連語の提示によって要求解釈の支援が可能となることを示した.This paper proposes a method for detecting the information demands of a large group of people by analyzing the keywords used on a WWW (World Wide Web) search service.In general,a variety of keywords are used to retrieve information on the same topic.These keywords differ according to each user's viewpoint.Therefore,they,that is related words in a sense,must be gathered and summed up to extract information needs accurately.In this paper,relationships between two keywords are measured by time interval between them,and by the correlation coefficient of the number of uses per day.By calculating these relationships once in a certain period of time,for example one week,and by combining them effectively,keywords for the same topic can be grouped together.We applied the proposed method to the access log for an actual WWW search service,and found that it was useful for interpreting each request as well as for understanding the true strength and trends of information demands.
著者
数原 良彦 植松 幸生 戸田 浩之 井上 孝史 片岡 良治
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.23, 2009

多数のユーザによって付与されたソーシャルアノテーションを用いた情報検索ではアノテーションが付与されているコンテンツのみを検索対象とするため,ウェブ全体を検索対象にできないという問題がある.本研究では,ソーシャルブックマーク数を正解としてランキング関数を学習することにより,ブックマークされていないウェブページについてもブックマーク件数を近似した検索ランキングを提案する.
著者
数原 良彦 植松 幸生 井上 孝史 片岡 良治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学
巻号頁・発行日
vol.108, no.329, pp.7-8, 2008-11-24

本研究では,ソーシャルブックマークにおけるスパマーのタグ付与行為が非スパマーとは異なると考え,ユーザのタグ付与行動に基づく特徴を抽出し,教師つき機械学習を用いてスパマーの判別器を生成することでスパマーの除去を行う手法を提案する.評価実験より,提案した特徴を用いて,スパマーの分類精度を保ったまま非スパマーの誤分類が減少されることを確認した.