著者
黒松 信行 小林 健一 Viel Emeric 浦 晃 上田 晴康
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:21888841)
巻号頁・発行日
vol.2015-HPC-150, no.18, pp.1-7, 2015-07-28

機械学習においては,処理するデータ量,得られる精度,実行に要する時間の制約を満たす中で,逐次・並列分散の観点も含めたライブラリやアルゴリズム,パラメータの膨大な組み合わせの中から最適なものを選択することは困難であった.そこで,許容できる実行時間と入力データを与えるだけで最も高い精度を得ることを目的として,条件を変えながら何度も機械学習を実行することで最適な選択肢を自動的に選ぶプラットフォーム wizz を Apache Spark 上に構築した.wizz は並列処理向けの Apache Spark の MLlib と逐次実行向けの R スクリプトおよび R スクリプトの分散実行によるアンサンブル学習機能を提供しており,並列処理ライブラリと逐次処理ライブラリを同時に多数実行することができる.