著者
小久保 卓 小山 聡 山田 晃弘 北村 泰彦 石田 亨
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.43, no.6, pp.1804-1813, 2002-06-15
被引用文献数
6

いまやインターネットは現代社会の中に急速に浸透しており,そのサービスの中でも特にWWW(World Wide Web)は新しいメディアとしてその情報量を増大させている.しかしながら最も一般的なWWW情報検索手法である検索エンジンは,必要な情報を得るためにある程度の知識や経験が必要とされ,多くの初心者にとって使いこなすのは容易ではない.こうしたWWW情報検索における問題の解決法の1つとして,ドメインを限定した専門検索エンジンの提供があげられている.そこで本論文では専門検索エンジンを構築するための新しい手法として``検索隠し味''を用いた手法を提案する.これはユーザの入力クエリに対しある特定のキーワードを追加すると,汎用検索エンジンの出力のほとんどがドメインに関係するWebページとなるという経験則を利用したものである.そして機械学習の一種である決定木学習アルゴリズムを元にWebページ集合からキーワードのブール式の選言標準形として検索隠し味を抽出するアルゴリズムを開発した.さらに本手法を料理レシピ検索に適用し評価実験を行うことで,その有効性の確認を行った.The WWW technology has come into wide use in our society as an infrastructure that supports our daily life. But gathering information from the WWW is a difficult task for a novice user even if he uses the search engines that are most widely used tool to retrieve information from the WWW. Because the user must have experience and skill to find the relevant pages from the large number of documents returned, which often cover a wide variety of topics. One solution to the problem is to build a domain-specific search engine. So this paper presents a new method that improves search performance by adding the domain-specific keywords, called keyword spices, to the user's input query; the modified query is then forwarded to a general-purpose search engine. We describe a machine learning algorithm, which is a type of decision-tree learning algorithm, that can extract keyword spices as a disjunctive normal form of keywords from Web documents. To demonstrate the value of the keyword spices, we conducted experiments in the cooking domain and the results showed the high performance.
著者
小久保 卓 小山 聡 山田 晃弘 北村 泰彦 石田 亨
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.43, no.6, pp.1804-1813, 2002-06-15

いまやインターネットは現代社会の中に急速に浸透しており,そのサービスの中でも特にWWW(World Wide Web)は新しいメディアとしてその情報量を増大させている.しかしながら最も一般的なWWW情報検索手法である検索エンジンは,必要な情報を得るためにある程度の知識や経験が必要とされ,多くの初心者にとって使いこなすのは容易ではない.こうしたWWW情報検索における問題の解決法の1つとして,ドメインを限定した専門検索エンジンの提供があげられている.そこで本論文では専門検索エンジンを構築するための新しい手法として``検索隠し味''を用いた手法を提案する.これはユーザの入力クエリに対しある特定のキーワードを追加すると,汎用検索エンジンの出力のほとんどがドメインに関係するWebページとなるという経験則を利用したものである.そして機械学習の一種である決定木学習アルゴリズムを元にWebページ集合からキーワードのブール式の選言標準形として検索隠し味を抽出するアルゴリズムを開発した.さらに本手法を料理レシピ検索に適用し評価実験を行うことで,その有効性の確認を行った.