著者
大槻 洋輔 佐藤理史
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告知能と複雑系(ICS) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.3, pp.165-172, 2000-01-12
被引用文献数
1 6

本論文では,地域情報ディレクトリを自動編集するシステムを提案する.本システムの中心技術は,情報源の自動収集と,ページの自動分類である.情報源の自動収集では,地域情報サイトに見られる典型的なURLパターンを利用して既存の地域情報リンク集を発見し,そこから情報源となるサイトのURLを収集する.この方法により,日本の全地域(3427自治体)の80%以上に対して,情報源を収集することができる.また,ページの自動分類では,収集した情報源サイト内のページを8つの種類のカテゴリに分類する.この分類は,それぞれのカテゴリに固有な表現が,ページのタイトルやアンカ文字列に現れるかどうかによって決定する.本ディレクトリは,地域別に情報を表示する地域モードと,カテゴリ別に情報を表示するカテゴリモードの両方を提供する.This paper proposes a system that edits a web directory of regional information automatically. The directory provides two views: regional view and category view. Two key technologies are automatic collection of regional web sites and automatic classification of web pages. The former finds existing link collections by using the URL prototypes of regional web sites, and extracts unknown regional web sites' URLs. This method can collect one or more web sites of 80 percent of all regions in Japan. The latter classifies the pages in the regional web sites into eight categories by using the category-specific expressions.