著者
竹内 成博 森田 武史 和泉 憲明 山口 高平
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. KBSE, 知能ソフトウェア工学 (ISSN:09135685)
巻号頁・発行日
vol.107, no.212, pp.43-48, 2007-09-03

セマンティックWebを実現するためには,既存のWebページに対して機械可読なRDF形式のデータを提供する必要がある.しかし,Web上にはすでに膨大なHTML形式のWebページがあり,それらに対して人手によってRDF形式のデータを提供することは困難である.本研究では,HTMLで記述されたWebページからデータを抽出し,オントロジーを用いることでRDF形式のデータに変換する手法を提案する.この手法により,従来の手法と比べて,HTMLからRDFを抽出するコストを下げることが出来る.