著者
小谷 彬 大島 裕明 小山 聡 田中 克己
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.106, no.149, pp.35-40, 2006-07-06

Webサイトには効率よく必要な情報を得るために,サイトマップが存在し,そのサイトの構造や内容に基づいて情報が整理され提示されている.ユーザにとっては,それが複数のWebサイト間で同様の形式で整理されていることが望ましい.なぜなら類似したWebサイト間において,共通の項目に関するページを比較して閲覧することは,ユーザにとって負担であり困難でもあるからである.そこで我々は複数のWebサイト間における共通属性を抽出し,その共通属性の各属性に該当するWebページを抽出する手法を提案する.その結果,複数のWebサイトに共通のサイトマップが生成できることになる.共通属性抽出においては,属性を一語で表すための手法について述べ,さらに属性間の階層化や類似属性の統合のために,複数の語で属性を現す属性拡張の手法についても述べる.