著者
小田 哲 中山 心太 上西 康太 木下 真吾
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IN, 情報ネットワーク (ISSN:09135685)
巻号頁・発行日
vol.111, no.409, pp.35-40, 2012-01-19
被引用文献数
1

Hadoopの登場により、安価なハードウェアを用いて大規模なデータに対する高度な分析手段が普及しつつあり、その分析の精度および速度がビジネスの成否を分けるようになってきた。すなわち、大規模かつ高度な分析をリアルタイム化することが重要となる。そこで我々は大規模かつ高度なリアルタイム分析のための分散機械学習フレームワークJubatusをPFI社と共同開発した。Jubatusのゴールは、(a)オンライン機械学習アルゴリズムなどの分析処理をスケールアウトするように分散処理できること、(b)これらの分散処理をアルゴリズム間で共通化すること、(c)これらの分析処理を容易に試行錯誤しながら利用できるようにすること、の3点である。我々は(a)に関してJubatusに高度な分析をスケールアウトさせるための仕組みとして一貫性要件を緩和したmixというデータの同期機構を組み込み、そのスケールアウト性を確認した。本稿ではmixの特徴について解説し、一貫性要件の緩和の程度について検証する。