著者
松本 知弥子 馬 強 田中 克己
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.101, no.192, pp.105-112, 2001-07-11

WWWの急激な進歩と普及によって, 多くの一般のユーザが多種多様な情報を受信・発信できるようになり, 情報資源の量は, 日々増加し続けている.ユーザが大量の情報の中から, 情報を検索することは非常に困難な作業である.特に, 地域密着情報のようなローカル的な情報を獲得するには, 従来の検索やフィルタリング手法は不十分である.本稿では, Webページのローカル度という新しい尺度を定義し, それに基づくフィルタリング手法を提案する.ローカル度の定義方法として, 1文書内のローカルさを特徴付ける地理用語や組織名の頻度・詳細度・位置情報と, 他のページとの関係からリンク構造解析や類似しているページの数を用いる.また, ローカル度の定義を評価するための予備実験の結果を示す.
著者
馬強 松本 知弥子 田中 克己
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.67, pp.515-522, 2002-07-18
被引用文献数
6

インターネットやデジタル放送の急激な進歩と普及によって,多くのユーザが多種多様な情報を受信・発信できるようになり,情報資源の量は日々増加し続けている.ユーザが大量の情報の中から,適切な情報を検索することは困難な作業である場合がある.特に,特定のユーザのみが興味を持つ,地域密着情報のようなローカル的な情報を獲得したり,排除するには,従来の情報検索やフィルタリング手法のみでは不十分である場合がある.本論文では,Webページがどの程度地域に密着しているかを計る尺度としてローカル度を定義し,その抽出手法と応用システムについて述べる.また,ローカル度の定義を評価するための予備実験の結果を示す.The vast amount of information is available on the WWW(World Wide Web). Usually, users use the information filtering technologies or search engines to acquire their favorite information. However, it's still not easy to acquire or exclude local information with the conventional search engines and information filtering technologies. In this paper, we propose a new notion localness to discover local information from the WWW. We also propose some useful applications based on localness and show some results of our preliminary evaluation.