- 著者
-
関堅吾
金子崇之
山下真一
- 雑誌
- デジタルプラクティス (ISSN:21884390)
- 巻号頁・発行日
- vol.5, no.2, pp.110-119, 2014-04-15
2013年10月現在,Twitterはアクティブユーザ数が2億人以上,1日の投稿ツイート数は5億件以上[1]と,最も活発なWebサービスの1つである.(株)NTTデータが運営する「Twitterデータ提供サービス」は,そのような大量の公開ツイートをFirehose APIを通じて収集し,すべての日本語ツイートを,特性の異なる複数のWeb APIによりユーザに提供するサービスである.Firehoseを利用するシステムは,トラフィックの継続的な増加,ツイート数の瞬間的な急増,データの再取得の難しさなど,さまざまな課題に対処する必要がある.本論文では,OSSを全面的に活用し,これらの課題に対応したシステムの事例を紹介する.