- 著者
-
横路 誠司
高橋 克巳
三浦 信幸
島 健一
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会論文誌 (ISSN:18827764)
- 巻号頁・発行日
- vol.41, no.7, pp.1987-1998, 2000-07-15
- 参考文献数
- 17
- 被引用文献数
-
13
インターネット上に分散するWWW文書を位置指向に検索するシステムを開発した.本システムでは,任意の地理的領域に属するWWW文書を検索することが可能である.本検索システムの実現のために,3つの手法を開発した.まず,位置指向検索に必要なWWW文書を選択的に収集する手法,次に,WWW文書から住所を抽出し,抽出住所を緯度経度と対応づけることによる構造化手法,そして,構造化された文書の緯度経度を用いた,地理的検索手法である.選択的収集手法は,WWW文書の内容を予測し,位置に関連した情報を高い割合で収集することができる.構造化手法では,住所辞書を持った形態素解析と,住所表記の正規化を用いて,WWW文書からの住所抽出を行った.その結果,正しい住所の抽出を保証したうえで,出現住所文字列の92%の抽出を丁目レベルで実現した.地理的検索手法では,構造化で付与された緯度経度情報と検索領域の重なりに存在するWWW文書の情報を提示する.この手法の評価実験を行った結果,提案手法は,検索領域として住所文字列を使用する従来のキーワード検索で少なくとも約25%存在していた検索もれを解消することができた."We developed a location-oriented search system for WWW documents on the Internet.This system can search WWW documents related to any geographical area.The system has three modules.(1) ``Location oriented selective information collecting robot''that collects documents from the Internet,(2) ``Location oriented structuring parser''that extracts address strings from the WWW documents andputs longitude-latitude information to the original document,(3) ``Location oriented structured search'' that performs geographical search.Our ``robot'' collects documents related to the location selectivelyby estimating the target document has the location information or not.Our ``parser'' extracts address strings using the morphological analysis andnormalization of address variants.It extracts 92% of detailed address strings while guaranteeingthe precision of the extraction.And our ``location oriented search'' method searches the documents whichits longitude-latitude overlaps to the polygon of the search request.This method can search all documentsthat conventional keyword search overlooks at least 25% of documents.