著者
芹沢 和洋 建部 修見
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:21888841)
巻号頁・発行日
vol.2019-HPC-170, no.9, pp.1-12, 2019-07-17

深層ニューラルネットワークに使用される訓練データの規模は年々増加しており,深層ニューラルネットワークの訓練処理において訓練データの read I/O は無視できないボトルネックになりつつある.ノードローカルストレージとして搭載された SSD などの I/O が高速なストレージデバイスを使用することで read I/O の高速化は可能であるが,HPC クラスタにおいては毎回訓練データセットのファイルコピーが毎回必要であるという課題がある.また,HPC クラスタの計算ノードからネットワークを経由してアクセス可能な外部ストレージは訓練データセットをファイルコピーせずに訓練処理を開始できるが,SSD ほどのバンド幅は見込めない.本研究では,ノードローカルストレージと外部ストレージを組み合わせて使用することで事前に訓練データセットのコピーをせずに read I/O を高速化する手法を提案する.提案手法を機械学習フレームワークである Chainer に実装し,Chainer が提供する並列に訓練データを read する機能をベースラインとして,read I/O 性能を自作したベンチマークによって比較したところ,Lustre に訓練データを配置した場合のベースラインよりも,より少ないプロセス数を使用して最大で約 20% 高い read I/O 性能を達成できることを示した.データ並列訓練における 10 epoch の訓練時間の比較では,訓練データセットのファイルコピーに要する時間を考慮するとベースラインと SSD の組み合わせよりも訓練処理時間を短縮できることを示した.一方で,データ並列訓練においては read I/O ではなく AllReduce による処理時間が律速するため,ストレージ間の I/O 性能が処理時間に反映されにくいという,データ並列訓練の所要時間における特性を明らかにした.
著者
芹沢 和洋 建部 修見
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:21888841)
巻号頁・発行日
vol.2019-HPC-168, no.25, pp.1-10, 2019-02-26

深層ニューラルネットワークの訓練には大量のデータが必要となり,訓練処理時間の長期化が問題となっている.訓練時間の短縮方法として,複数の訓練データを用いて訓練処理を行うミニバッチ訓練という手法が知られている.本研究では,訓練処理時間と関連性が考えられる,訓練処理中の GPU 利用率を最大化するという最適化手法を用いて.訓練処理時間を可能な限り最短にすることができるミニバッチサイズを決定する方法を提案した.提案手法を深層学習フレームワークである Chainer を用いて実装した.Cifar 100 と ImageNet の 2 種類の画像データセットおよび VGG 16 と ResNet 50 の 2 種類の畳み込みニューラルネットワークを用いて提案手法の評価を行った結果,GPU 利用率のみを最大化するアプローチでは訓練処理速度を最短とするミニバッチサイズを決定することは困難であるという結論となった.一方で,データセットごとに訓練処理中の GPU 利用率とミニバッチサイズとの間の相関性に異なる傾向が観察され,データサイズに起因するボトルネックが GPU 利用を阻害している可能性が発見された.
著者
庄野 浩資 芹沢 和洋 山口 香子 牛草 貴行 松嶋 卯月 小出 章二 立澤 文見 武田 純一
出版者
Japanese Society of Agricultural Informatics
雑誌
農業情報研究 (ISSN:09169482)
巻号頁・発行日
vol.21, no.4, pp.95-105, 2012

岩手県における主要花卉作物である切り花リンドウは,劣化すると茶褐色の"老花"となって商品価値を大きく損ねる.このため,これまで切り花の生育レベル,特に若花と変色前の早期老花を"色彩情報"に基づいて判別する技術の研究が進められてきた.本研究の特徴は,判別に利用する情報として,リンドウ花冠の"光沢"に関連する情報に注目した点にあり,今回はその定量化の方法の開発と生育レベルとの関係性を検討した.具体的には,まず2つの偏光フィルタを用いて,花冠の光沢と散乱光を含む画像,さらには,散乱光のみを含む画像それぞれの撮影を実現する低コストな画像撮影装置を開発した(ダブル偏光フィルタ法).次に,得られた画像から平滑度指標などの光沢に関連する情報を求め,これらと生育レベル間の関連性を検討し,同情報に基づく生育レベル判定の可能性を検討した.この結果,エゾリンドウ系統2品種において,平滑度指標に基づいて若花と早期老花を良好な正解率で判別可能であることを確認した.以上から,本研究におけるダブル偏光フィルタ法による光沢の定量化は,切り花リンドウの生育レベルの低コストな非破壊・非接触的測定手法の実現に十分寄与すると考えられる.<br>