著者
関堅吾 金子崇之 山下真一
雑誌
デジタルプラクティス (ISSN:21884390)
巻号頁・発行日
vol.5, no.2, pp.110-119, 2014-04-15

2013年10月現在,Twitterはアクティブユーザ数が2億人以上,1日の投稿ツイート数は5億件以上[1]と,最も活発なWebサービスの1つである.(株)NTTデータが運営する「Twitterデータ提供サービス」は,そのような大量の公開ツイートをFirehose APIを通じて収集し,すべての日本語ツイートを,特性の異なる複数のWeb APIによりユーザに提供するサービスである.Firehoseを利用するシステムは,トラフィックの継続的な増加,ツイート数の瞬間的な急増,データの再取得の難しさなど,さまざまな課題に対処する必要がある.本論文では,OSSを全面的に活用し,これらの課題に対応したシステムの事例を紹介する.