著者
手塚太郎 李龍 高倉 弘喜 上林 弥彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.67, pp.503-508, 2002-07-18
被引用文献数
1

World Wide Web(以下、WWW)は日常的な情報収集の手段として広く用いられているが、地域関連情報の検索はその重要な一角を占める。本研究ではWWW上のテキストデータに対する内容解析によって人間の地理空間認知の構造を明らかにし、地域情報検索の効率化に役立てる。自然言語において地名は格助詞を伴って現れることが多い。そこで格助詞の意味分析を行ない、共起しやすい格助詞の種類によって地名を特性付けした。地名には狭義と広義のふたつの意味を持つものが多く、解釈において困難を生じさせているが、その判定に格助詞との共起パターンを用いられることを示した。World Wide Web is now widely used as a tool for daily information search. One important usage of WWW is to search local information. Our paper discusses human cognition on geographic space. In Japanese text data, most place names appear with case intensifying particles. We performed analysis on case intensifying particles and characterized place names based on which particles it is likely to co-occur with. There are many place names that have more than one meaning: the original meaning and the extended meaning, which surrounds the original. We showed that the characterization based on case intensifying particles could be used to determine such duplication of the meaning.
著者
郡 宏志 服部 峻 手塚太郎 田島 敬史 田中 克己
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.78, pp.35-42, 2006-07-13
被引用文献数
5

近年,ユーザが Blog の中で自らの観光行動を日記として発信することが盛んになってきている.そのような Blogの中には,ユーザの観光時の行動経路が記述されていることも多い.そこで,我々は Blogからユーザの観光時の代表的な行動経路とその文脈を抽出し,それらを地図上にマッピングすることにより集約して提示するシステムを提案する.ユーザの行動経路の文脈は,その経路を経由したユーザの観光行動のテーマを表すキーワードという形で表される.また,ユーザの代表的な行動経路については,代表的なシーケンシャルパターンマイニングであるPrefixSpanを用いて抽出する.また,マイニングを行うために,各 Blogエントリから個々のBlogの書き手の行動経路を抽出する.その際に,我々は地名が指す場所におけるビジターの行動に着目することで各 Blogエントリからビジターの行動経路を抽出する.こうしてマイニングした代表的な経路に対して,システムはその経路の文脈であるキーワードを抽出する.このような,ビジターの経路及びそのコンテキストを提示するシステムは,ユーザの実空間における行動計画の立案を支援すると我々は考える.Recently, it is common that users release their sightseeing through internet by blog. Route that the user passed is often described in blog. Then, we propose a system that extracts visitors' typical geographical route and its context and shows on map collectively. Context of typical route is described by keywords which express the theme of the visitors. We extract typical route by representative sequential pattern mining method "PrefixSpan". Moreover, for mining the typical route, We extract each visitor's route for one blog entry.Then we focus on whether the visitor did some action at the place. Thus, for extracted typical route we extract the keyword which is the context of the route. This system supports user's plan to visit some place.