著者
大平 哲也 服部 司 佐藤 真人
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DE, データ工学 (ISSN:09135685)
巻号頁・発行日
vol.109, no.293, pp.9-14, 2009-11-12

サイバーエージェントが展開する「Ameba」は650万人の会員ユーザーを集めるブログを中心とした国内最大規模のインターネットサービスであるが、ユーザー数に比例して日々蓄積されるデータがブログ記事のテキストデータで30GB/月(2009/10月現在)を超える膨大なものになっている一方、社内でのデータ解析やその再利用が遅れていた。対策の一環として、2009年1月に研究開発を行う組織(インキュベーションラボラトリー)を新設し、社内に蓄えられた膨大なデータの解析と、解析結果を基にしたコンセプトアプリの開発ならびに現場への応用を進めている。その一例として、ブログサービス内でのトレンドワードの解析を実施している「Keyword Tracker」と、汎用的なspamフィルタリングプラットフォームとして構築を進めている「spamフィルターAPI」について、採用している技術的なアプローチの紹介とデータを解析してみて得られた結果ならびに知見の報告を行う。