著者
吉岡 真治 劉 亦奇 神門 典子
出版者
情報処理学会
雑誌
情報処理学会論文誌データベース(TOD) (ISSN:18827799)
巻号頁・発行日
vol.5, no.3, pp.141-148, 2012-09-28

近年,地理情報を扱う情報システムの増加にともない,地理情報に関するデータベースへのニーズが高まっている. GeoNames は, Open Data としては,最大規模の地理情報データベースである.本データベースを Linked Open Data として Wikipedia の情報を媒介として関連づけることにより, Web Ontology の開発などに役立てられている.ただし, GeoNames と Wikipedia の間のリンクについては,自動的なリンク発見の試みがいくつか行われているものの,十分な数のリンクが付与されている状態ではない.本論文では, Wikipedia のカテゴリ情報を使うことで,精度良く Wikipedia のページに対応する GeoNames のエントリを発見する方法を提案する.また,本手法は,既存のリンク中の不適切なリンクを発見する際にも利用可能であることを示す.本手法の成果については,すでに, GeoNames の管理者に報告しており,その成果の一部は, GeoNames 中のリンク情報として公開・修正が行われている.Recently, due to the higher demand for geographic information system, it is necessary to have a good geographical database for such systems. GeoNames is one of the largest geographical database as Open Data. This database is also used for constructing web ontology by adding links to the Wikipedia page as a part of Linked Open Data. Even though, here are several attempts to find links automatically, the number of links between GeoNames and Wikipedia is not sufficient. In this paper, we propose an automatic link discovery method to use Wikipedia categories to identify the correspondence between Wikipedia page and GeoNames entry. We also propose to use this method for inappropriate link detection. Link data obtained in this paper is already sent to the manager of GeoNames and a part of the result is used for updating the site.

言及状況

はてなブックマーク (1 users, 1 posts)

[tech][data][データマイニング]

収集済み URL リスト