著者
荒谷 寛和 藤田 茂 菅原 研次
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.46, no.2, pp.337-347, 2005-02-15
参考文献数
13
被引用文献数
5

近年,ウェブ情報検索の分野で,PageRankに代表されるウェブのリンク構造を用いたランキング手法が主流となってきている.しかし,著名なサイトや一般的なトピックが有利に評価される傾向があり,一方で重要な情報を含むページが低く評価されることがある.本論文では,ウェブページ間で内容の類似に基づく相互評価を行うことで,セマンティクスを考慮した検索手法を提案する.次に,本提案手法に基づいて,ウェブ検索システムを設計し,評価実験のための試作システムを実装した.評価実験では,フィルタとしてGoogleの検索結果上位200件を用い,本提案手法に基づく検索結果とGoogleの検索結果を比較した結果,提案手法が,検索者が望むランキングに近い結果であることを確認した.In recent years, link-based ranking methods of web pages, such as the PageRanking algorithm of the Google, have been developed in order to improve the quality of searching function. The PageRanking algorithm calculates ranking of web pages based on only the structure of hyperlinks among web pages without semantic relationships among web pages. Therefore, a page which many users want to obtain from the WWW might be ranked in a low position of a retrieved list when it is not so popular. In this paper, we propose a semantic-oriented ranking method which calculates ranking of web pages based on mutual evaluation among web pages which calculate an evaluating value of the objective web page according to key words and its own content. We designed and prototyped a retrieving system based on the proposed method. The experimental system retrieved and ranked sets of 200 web pages according to given key words, and the results were analyzed comparing to the ranking result of the Google for the same key words.
著者
荒谷 寛和 藤田 茂 菅原 研次
出版者
日本知能情報ファジィ学会
雑誌
知能と情報 (ISSN:13477986)
巻号頁・発行日
vol.18, no.2, pp.196-212, 2006 (Released:2007-04-20)
参考文献数
21
被引用文献数
3

これまで我々は, ウェブ検索エンジンのランキング手法として, ウェブページ間相互評価手法を提案してきた. 従来のウェブページ間相互評価手法は, 適用対象とするウェブページ集合の中に高適合および適合ページが15%以上含まれていない場合に, ランキング精度が改善されないという課題が残されていた. この課題に対し, 本稿では, 新たにテキスト要約技術と適合度の推定を用いる評価関数を組み合わせる事で, 手法のランキング精度の改善を行った. 提案手法を評価するために, 第3回NTCIRワークショップのウェブ検索タスクで用いられたテストコレクションによる評価を行った. この結果, 従来手法で課題であった状況に対する改善が見られ, 同一のテストコレクションを用いた, 他の検索システムとの検索結果の評価尺度であるDCGによる比較において, 本手法がより良い順位付けを行っている事を確認した.