著者
池辺 正典 田中 成典 古田 均 中村 健二 小林 建太
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.47, no.6, pp.1687-1695, 2006-06-15

近年のインターネットの複雑化にともない,Web の自動解析による情報取得に対する需要が高まっている.そのため,Web ページをカテゴリに分類する手法やWeb の関係情報を解析する手法が数多く提案されてきた.しかし,既存の研究では,Web の自動解析は,リンク関係を中心とした解析を行っており,リンク関係のないWeb ページを関連付けることが困難であった.このため,本論文では,リンク構造解析だけでなく,形態素解析によって任意の単語から関係情報の抽出を行うことで,リンク関係のないWeb ページを関連付ける.また,その結果と品質判定を行ったリンク構造解析結果を組み合わせることで,信頼性の高いWeb ページの関係図を作成する.さらに,アルゴリズムの評価として,Web から取得した情報を利用して,組織の関係図を作成する.そして,既存研究においての主要な方式であるリンク構造解析による結果との比較を行った.評価方式には,リンク構造解析で一般的に用いられている評価値とグラフ理論による可視化を採用し,その結果から本方式の有用性を確認した.