著者
大塚 博紀 吉岡 真治
出版者
一般社団法人情報処理学会
雑誌
研究報告デジタルドキュメント(DD)
巻号頁・発行日
vol.2009, no.35, pp.9-14, 2009-03-18

Web 文書の特徴はリンクによりお互いの文書の関係が示されている点にあり、この情報は PageRank に代表される Web 空間の解析手法に用いられている。しかし、これらの解析では、サイト内、サイト外といった分類は考慮されているものの、ページの中でのアンカーテキストの役割には、注目していない。本研究では、このアンカーテキストの役割の違いに注目し、適切に分類することで、リンク構造解析や Web ページ上でのユーザーの行動解析に役立てる事を目標としている。本稿では、人手による役割分析の結果に基づいたアンカーテキストの自動分類システムを提案する。また、その有効性を検証するために、実際に人手の分類とシステムの出力を比較した結果について報告する。A Link Structure among Web documents represents the relationship among these documents. Web structure analysis methods such as PageRank use this information. However, most of these methods pay little attention to the type of link (e.g., most of the methods use simple classification such as link to the same site or not). In this research, we proposed a method to classification criteria of anchor texts based on the role analysis of the text in Web documents for better link structure analysis and the users' behavior analysis on the Web page. In this paper, we propose an automatic classification method based on the result of manually classification experiment. In order to evaluate this method, we compare the result of automatic classification results with manually classified ones.