著者
西出 頼継 本間 維 永森 光晴 杉本 重雄
出版者
一般社団法人情報処理学会
雑誌
研究報告情報基礎とアクセス技術(IFAT)
巻号頁・発行日
vol.2013, no.4, pp.1-8, 2013-09-19

近年,誰もが利用・アクセスを行え,再利用や再配布が許可されたデータセットである Open Data が増えてきている.しかし,Open Data の構造は複雑なものが多く,スキーマ定義がないと再利用が難しい.また日本において LOD として公開されている Open Data の数は世界全体と比べると少ない.本稿では,日本で公開されている Open Data を LOD として活用することを目的に,CKAN 日本語などで公開される日本のデータセットを対象にスキーマの分析やリンク関係などの調査を行った.その結果日本の Open Data ではスキーマ定義やデータセット間のリンクが少ないということが分かった.そして,Open Data を LOD として活用するためにはスキーマ定義を行うためのメタデータ語彙の推薦や,リンクで結ぶためのリソースの同定が必要であると考察した.In recent years, there has been an increase in the use of Open Data. These datasets are freely available to everyone to reuse and republish. Unfortunately, many Open Data structures are complicated and are difficult to reuse without a schema definition. Compared with the rest of the world, Japan releases relatively little Open Data as LOD. We investigated Japanese Open Data, focusing on CKAN-Nihongo schemas and links to improve the use of datasets as LOD. We found that there are few Japanese Open Data schemas and links. Therefore, we recommend that metadata vocabularies and identification of links to connect resources should make use of Open Data released as LOD.
著者
本間 維 永森 光晴 杉本 重雄
雑誌
研究報告情報基礎とアクセス技術(IFAT)
巻号頁・発行日
vol.2011, no.8, pp.1-8, 2011-11-15

Web 上で公開されている Web ページ中にメタデータを記述するために,RDFa や Microformats,Microdata など複数の標準的な記述フォーマットが提案されている.しかし,標準的な記述フォーマットに従ったメタデータを持つ Web ページの数はまだ少なく,メタデータを利用した情報流通支援を行うには,より積極的なメタデータ付与が求められる.本稿では,DCMI Description Set Profile を基にした情報抽出テンプレートによる,相互利用性向上や作成コスト軽減を意識したメタデータ生成手法を提案する.Standard metadata formats, such as RDFa, Microformats, and Microdata, have been recommended to embed metadata in HTML or XHTML documents. However, many web pages have no metadata written in those formats. The other side, non-standard formats describing information for layout of web pages is used widely. For increasing metadata more proactively, we regard information in non-standard formats as metadata, and integrate with metadata in standard formats. This paper proposes a method to create metadata from resources with embedded metadata in standard and non-standard formats.