著者
三浦 信幸 横路 誠司 井上 香織 高橋 克巳 高橋 健司 島 健一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. HI,ヒューマンインタフェース研究会報告 (ISSN:09196072)
巻号頁・発行日
vol.86, pp.39-44, 1999-11-25

本稿では,インターネット上に存在する雑多な形式の情報を,位置に応じて適切に提供するための情報構造化や情報フィルタリングを行う手法を検討する.このような情報を適切に提供するためには,雑多な形式の情報に対して構造化を行い,構造化された結果を利用して,位置を含めた様々な観点から情報を分類・フィルタリングする必要がある.検討した手法では,情報構造化に際してパターンマッチや特定分野の辞書を用いた形態素解析などを行う.また,情報フィルタリングに際しては,構造化された情報と構造化されなかったHTMLファイル中の名詞や固有名詞の中からtfidf値を参考に頻出する情報を抽出する.さらに,検討した手法のプロトタイプである,モーバイルインフォサーチ3実験(MIS3)について紹介する.
著者
横路 誠司 高橋 克巳 三浦 信幸 島 健一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.41, no.7, pp.1987-1998, 2000-07-15
参考文献数
17
被引用文献数
13

インターネット上に分散するWWW文書を位置指向に検索するシステムを開発した.本システムでは,任意の地理的領域に属するWWW文書を検索することが可能である.本検索システムの実現のために,3つの手法を開発した.まず,位置指向検索に必要なWWW文書を選択的に収集する手法,次に,WWW文書から住所を抽出し,抽出住所を緯度経度と対応づけることによる構造化手法,そして,構造化された文書の緯度経度を用いた,地理的検索手法である.選択的収集手法は,WWW文書の内容を予測し,位置に関連した情報を高い割合で収集することができる.構造化手法では,住所辞書を持った形態素解析と,住所表記の正規化を用いて,WWW文書からの住所抽出を行った.その結果,正しい住所の抽出を保証したうえで,出現住所文字列の92%の抽出を丁目レベルで実現した.地理的検索手法では,構造化で付与された緯度経度情報と検索領域の重なりに存在するWWW文書の情報を提示する.この手法の評価実験を行った結果,提案手法は,検索領域として住所文字列を使用する従来のキーワード検索で少なくとも約25%存在していた検索もれを解消することができた."We developed a location-oriented search system for WWW documents on the Internet.This system can search WWW documents related to any geographical area.The system has three modules.(1) ``Location oriented selective information collecting robot''that collects documents from the Internet,(2) ``Location oriented structuring parser''that extracts address strings from the WWW documents andputs longitude-latitude information to the original document,(3) ``Location oriented structured search'' that performs geographical search.Our ``robot'' collects documents related to the location selectivelyby estimating the target document has the location information or not.Our ``parser'' extracts address strings using the morphological analysis andnormalization of address variants.It extracts 92% of detailed address strings while guaranteeingthe precision of the extraction.And our ``location oriented search'' method searches the documents whichits longitude-latitude overlaps to the polygon of the search request.This method can search all documentsthat conventional keyword search overlooks at least 25% of documents.