- 著者
-
大塚 浩司
大町 真一郎
阿曽 弘具
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会研究報告. DBS,データベースシステム研究会報告 (ISSN:09196072)
- 巻号頁・発行日
- vol.140, no.2, pp.415-420, 2006-07-14
- 参考文献数
- 6
共通のトピックに関するウェブページの集合であるウェブコミュニティを抽出する手法の1っとしてHITSアルゴリズムが知られている.HITSアルゴリズムは,ウェブコミュニティを"オーソリティ"と"ハブ"と呼ばれる2種類のウェブページからなる2階層の構造をしていると仮定し,これを2部グラフと見なして抽出することを目的としている.しかし,一般にウェブコミュニティはより複雑なリンク構造を持っている.本論文では,3階層以上の多階層のリンク構造を持つウェブコミュニティを抽出することを目的とし,オーソリティ・ハブに加えて中間ノードを導入したウェブコミュニティ抽出法を提案する.提案手法により,HITSアルゴリズムでは抽出しにくいページをウェブコミュニティのメンバとして抽出することが可能であることを実験により示す.