- 著者
-
中山 浩太郎
原 隆浩
西尾 章治郎
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会研究報告電子化知的財産・社会基盤(EIP) (ISSN:09196072)
- 巻号頁・発行日
- vol.2006, no.128, pp.115-122, 2006-11-30
Wikipediaは,WWW上に構築された百科事典であり,誰もが簡単にWebブラウザを通じて編集可能であるために,膨大な数の記事が投稿,公開されている.しかし,2005年末から2006年初頭にかけて,虚偽の記事が投稿されるような事件が発端となり,コンテンツの信頼性が大きな問題となってきた.筆者らは,これまでの研究でWikipediaにおける記事同士の関係性を抽出する手法について提案し,その有効性を証明してきたが,このように不特定多数のユーザがコンテンツを管理するような環境においては,信頼性を考慮した解析手法が重要となる.本研究では,Wikipediaのダイナミクスと信頼性の問題を分析するとともに,リンク構造解析アルゴリズムについて検討し,記事関連性抽出における信頼性の高い情報抽出方法を模索する.Wikipedia is a Web-based dictionary that can easily be edited through Web browsers by any Internet user. Thus huge amounts of articles are published and managed on it. However, after a number of article reliability issues, the trust problem on Wikipedia is still in controversy. In previous works, we proved the effectiveness and potential of the article association extraction based on Wikipedia mining. In this paper, we first analyze the link structure of Wikipedia and dynamics of Wikipedia. Then, we present an effective method for link structure mining for Wikipedia and describe how link structure mining for Wikipedia is helpful for extracting trusted information.