山田 直治 李龍 高倉 弘喜 上林 弥彦
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2002, no.67, pp.509-514, 2002-07-18

WEB上には多種多様な情報が大量に存在するため、利用者の要求に適した情報を収集することが困難になっている。ここでは携帯端末からWEB上に存在する地域情報を収集するために、WEB情報の地域性と記述形式に着目する。既存のキーワード検索では地名の位置情報を考慮していないため、任意の地域的範囲に関する情報を収集することが困難である。また要約情報なのか詳細情報なのかといったWEBページの記述形式を考慮していないため、利用者の要求する情報の詳しさに対応することができない。記憶領域が限られ通信が不安定な携帯端末では利用者の要求する情報のみを提供する必要があるため、これらは大きな問題である。ここでは地名の位置情報を利用してWEBページが着目する地域を特定する。またHTMLタグや品詞の出現度数の特徴からWEBページを目次型、要約型、詳述型の3つのタイプに分類する。最後に利用者の特定の地域に対する興味の深さに基づき、2つの尺度を用いた携帯端末へのキャッシュアルゴリズムについて述べる。Due to the rapid increase of the amount of web pages on the Internet, it is difficult to collect information that satisfies users' queries. This paper focuses on the geographic characteristics and description types of web resources. Keyword based search does not take account of the positional information of geographic names so that it cannot collect web resources on specific region. Furthermore, because a web page is treated without considering whether it contains detailed information or summarized one, the page may not satisfy users' requirements. In this paper, a method to determine the geographic scope and level of details of web pages is developed. Geographic scope is identified with the positional information of geographic names. Level of Details classified web pages into three types, "table-of-contents type", "summary type", and "detailed description type", with HTML tags and frequency of parts of speech. The cache algorithm with these two measures for mobile computing based on users' interests is also described.
手塚太郎 李龍 高倉 弘喜 上林 弥彦
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
vol.2002, no.67, pp.503-508, 2002-07-18

World Wide Web(以下、WWW)は日常的な情報収集の手段として広く用いられているが、地域関連情報の検索はその重要な一角を占める。本研究ではWWW上のテキストデータに対する内容解析によって人間の地理空間認知の構造を明らかにし、地域情報検索の効率化に役立てる。自然言語において地名は格助詞を伴って現れることが多い。そこで格助詞の意味分析を行ない、共起しやすい格助詞の種類によって地名を特性付けした。地名には狭義と広義のふたつの意味を持つものが多く、解釈において困難を生じさせているが、その判定に格助詞との共起パターンを用いられることを示した。World Wide Web is now widely used as a tool for daily information search. One important usage of WWW is to search local information. Our paper discusses human cognition on geographic space. In Japanese text data, most place names appear with case intensifying particles. We performed analysis on case intensifying particles and characterized place names based on which particles it is likely to co-occur with. There are many place names that have more than one meaning: the original meaning and the extended meaning, which surrounds the original. We showed that the characterization based on case intensifying particles could be used to determine such duplication of the meaning.