著者
坂倉悠太 天笠俊之 北川博之
雑誌
第74回全国大会講演論文集
巻号頁・発行日
vol.2012, no.1, pp.609-610, 2012-03-06

インターネットの普及に伴い、ソーシャルブックマークサービスが有益な情報源として普及している。一方で、このサービスを悪用するユーザ(スパマー)が現れて問題になっている。このようなスパマーの存在により、悪質なブックマーク情報が増加するため、ソーシャルブックマークサービスの情報源としての質の低下が懸念されている。そこで、本研究では、ソーシャルブックマークにおけるグラフ構造に基づいたスパマー検出手法の改良を行う。
著者
坂倉 悠太 天笠 俊之 北川 博之
雑誌
研究報告データベースシステム(DBS)
巻号頁・発行日
vol.2012, no.3, pp.1-8, 2012-07-25

本稿では,閲覧者の増加や検索エンジン最適化のために多くのユーザアカウントを用いて対象 Web リソースをブックマークする "複数のユーザアカウントを用いた集中的ブックマーク (Intensive Bookmarking using Multiple Accounts, IBMA)" の検出手法を提案する.効率的に IBMA を検出するために,ブックマーク中の Web リソースもしくは Web サイトの共通性に基づいて,ユーザアカウントのクラスタリングをする.具体的には,類似した Web リソースもしくは Web サイトの集合をブックマークしているユーザアカウントをクラスタリングする.このために,二つのブックマーク集合に対する三つの類似度を提案する.実験により,提案手法が,実際のデータセットにおいて IBMA を正しく検出できることを示した.また,類似度ごとの提案手法の精度を評価し,特徴を述べる.This paper proposes a scheme of detecting "Intensive Bookmarking using Multiple Accounts" (IBMA), where many social bookmark accounts are used to create bookmark entries linking to the target web resources with the aim of increasing site visitors or optimizing search result ranking. To efficiently detect IBMA, we propose to use clustering social bookmark user accounts according to the similarity with respect to the bookmarked web resources or web sites. Specifically, we cluster users who create bookmarks linking to similar set of web resources or web sites. For this, we propose three similarity measurements over two sets of bookmarks. We experimentally show that the proposed scheme successfully detects IBMA spammers in a real dataset. We also evaluate the accuracy of the proposed scheme with varying the similarity measurements, and characterize them.