著者
関堅吾 金子崇之 山下真一
雑誌
デジタルプラクティス (ISSN:21884390)
巻号頁・発行日
vol.5, no.2, pp.110-119, 2014-04-15

2013年10月現在,Twitterはアクティブユーザ数が2億人以上,1日の投稿ツイート数は5億件以上[1]と,最も活発なWebサービスの1つである.(株)NTTデータが運営する「Twitterデータ提供サービス」は,そのような大量の公開ツイートをFirehose APIを通じて収集し,すべての日本語ツイートを,特性の異なる複数のWeb APIによりユーザに提供するサービスである.Firehoseを利用するシステムは,トラフィックの継続的な増加,ツイート数の瞬間的な急増,データの再取得の難しさなど,さまざまな課題に対処する必要がある.本論文では,OSSを全面的に活用し,これらの課題に対応したシステムの事例を紹介する.

言及状況

はてなブックマーク (1 users, 2 posts)

[hadoop, twitter] NTT データによる Twitter データ収集サービスのインフラ構成に対する知見
[hadoop, twitter] NTT データによる Twitter データ収集サービスのインフラ構成に対する知見

Twitter (2 users, 2 posts, 0 favorites)

これかな NTT Data の Twitter データ提供サービスのヤツ / 情報学広場:情報処理学会電子図書館 https://t.co/YmAzCcvfgv
「情報処理学会の論文」これかな? https://t.co/whl5I19glW #hcj2014

収集済み URL リスト