- 著者
-
山田 直治
李龍
高倉 弘喜
上林 弥彦
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
- 巻号頁・発行日
- vol.2002, no.67, pp.509-514, 2002-07-18
WEB上には多種多様な情報が大量に存在するため、利用者の要求に適した情報を収集することが困難になっている。ここでは携帯端末からWEB上に存在する地域情報を収集するために、WEB情報の地域性と記述形式に着目する。既存のキーワード検索では地名の位置情報を考慮していないため、任意の地域的範囲に関する情報を収集することが困難である。また要約情報なのか詳細情報なのかといったWEBページの記述形式を考慮していないため、利用者の要求する情報の詳しさに対応することができない。記憶領域が限られ通信が不安定な携帯端末では利用者の要求する情報のみを提供する必要があるため、これらは大きな問題である。ここでは地名の位置情報を利用してWEBページが着目する地域を特定する。またHTMLタグや品詞の出現度数の特徴からWEBページを目次型、要約型、詳述型の3つのタイプに分類する。最後に利用者の特定の地域に対する興味の深さに基づき、2つの尺度を用いた携帯端末へのキャッシュアルゴリズムについて述べる。Due to the rapid increase of the amount of web pages on the Internet, it is difficult to collect information that satisfies users' queries. This paper focuses on the geographic characteristics and description types of web resources. Keyword based search does not take account of the positional information of geographic names so that it cannot collect web resources on specific region. Furthermore, because a web page is treated without considering whether it contains detailed information or summarized one, the page may not satisfy users' requirements. In this paper, a method to determine the geographic scope and level of details of web pages is developed. Geographic scope is identified with the positional information of geographic names. Level of Details classified web pages into three types, "table-of-contents type", "summary type", and "detailed description type", with HTML tags and frequency of parts of speech. The cache algorithm with these two measures for mobile computing based on users' interests is also described.