著者
相良 毅 喜連川 優
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.48, no.11, pp.49-57, 2007-06-15
被引用文献数
3

Webから地理情報を抽出する手法の1つに,あらかじめ検索対象のリストを作成し,クローリングによって得られた情報を各検索対象に関連づける登録型検索手法がある.登録型検索手法は,リストを用意せずにオンデマンドに検索を行う非登録型検索手法に比べ,より多くの情報を高い精度で収集できるという長所があり,評判情報抽出など情報の精度を必要とする処理には適しているが,リストに登録されていない対象に関する情報を収集することができないという欠点がある.そこで,登録型検索手法により収集されたWebページを対象として非登録型検索手法を援用することにより,リストにない新規店舗を高い精度で検索し登録できる手法を提案し,登録支援システムを開発した.To extract geographical information from the Web, there are two typical approaches. The 1st one is preparing all geographical entities as a list, and crawled web pages will be linked to them by analyzing their content. The other one is retrieving web pages on demand with keywords given by the user, extract addresses from the pages to locate them to the ground. The 1st approach is more precise and able to acquire more information in general, so the approach is suitable for reputation / opinion extraction, however, no entities on the list can not be retrieved by the approach. Therefore, we have applied the 2nd approach to find new shops which are not on the list, from the web pages retrieved by the 1st approach. Since the web pages retrieved by the 1st approach contain many shop information in high probability, the proposed method can extract new shops efficiently. A prototype registration support system is also developed.
著者
有川 正俊 相良 毅
出版者
東京大学
雑誌
特定領域研究
巻号頁・発行日
2003

位置をキーとして検索されるべきコンイテンツが質・量ともに不十分であることが問題となっている.そこで,われわれはこのような位置をキーとして管理される情報を「空間コンテンツ」と呼び,各種情報源から空間コンテンツを獲得・管理する手法の開発を行った.本研究では,(1)Web文書と(2)映像を対象に,位置情報を利用したコンテンツの獲得・抽出・管理・統合・提供の手法およびプロトタイプシステムを開発した.以下では,2つの課題の成果をそれぞれ説明する.1.Web文書からの空間コンテンツ獲得手法[目的]・特定の地域・特定の業種に関するページを短時間で収集する・収集したページから,エラー・情報の少ないものをできる限り除去する[開発した手法]・タウンページの店名・電話番号・住所をキーワードとして利用した検索精度の向上・後処理で住所一致を確認し,同名他店を除去・複数の店舗情報が含まれるページのブロック分割・揚所とキーワードによる検索システムを開発・一致度・ブロックに含まれる文字数による順位付け2.高精度な空間情報付き写真データの管理手法[目的]・空間メタデータを持つ写真データ(空間情報付き写真)の管理手法の体系化[開発した手法]・写真データが3次元実空間から切り取るボリューム(Field of View)を決定するパラメータ(視点,撮影方向,画角)を空間メタデータとて付与し,各過程(空間索引/検索手順/ユーザインタフェース)において適切な形状で扱う枠組みの開発・ある位置を見る写真/ある位置から見る写真/今見ている位置を横から見る写真,等の検索機能・各場所がどれだけ多くの写真に写されているのかという密度の視覚化機能・3次元位置情報を持った文字情報(店舗名や建物名等)の写真上への動的な重ね合わせ機能・空間メタデータを持たない写真と地図上とで対応する数点をクリックすることで,空間メタデータ(視点と撮影方向)を作成するツールの実装
著者
相良 毅 喜連川 優
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.91, no.3, pp.531-537, 2008-03-01
被引用文献数
1

Webからの店舗情報収集を行う際には,収集したWebページがある店舗に関連することを確認するため,店舗名称を識別語として利用する必要がある.しかし,店舗データベースに登録されている店舗名称には,支店名などWebページには記載されていない可能性のある語(不要語)が含まれているため,収集したページを正しく関連づけられないという問題がある.不要語にはビル名を用いた支店名など多くのバリエーションがあり,不要語辞書を整備して除去することは難しい,そこで,店舗データベースに含まれる住所の情報や,周辺の駅名,同じ住所に存在する複数の店舗名称を用いることにより,店舗名称をクリーニングする手法を開発した.実験によると,提案手法のクリーニング正解率は95.3%と実用的な性能を示した.