著者
荒井 勇亮 佐藤 功人 滝沢 寛之 小林 広明
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2010-HPC-124, no.11, pp.1-7, 2010-02-15

近年,従来の CUDA に加えて,GPGPU プログラミングのための新たな標準プログラミング環境として OpenCL が利用可能となった.本論文では,CUDA と OpenCL のプログラムの実行性能差を定量的に評価する.まず,ほぼ同等の処理を行う CUDA と OpenCL のプログラムを実装し,性能を比較する.次に,その性能差の主要因を調査し,CUDA コンパイラではサポートされているいくつかのコンパイラ最適化手法が,現在の OpenCL コンパイラではサポートされていないことを明らかにする.最後に,OpenCL コンパイラで生成されるコードを手動で最適化することによって CUDA と同等の性能を達成できた結果から,今後の OpenCL コンパイラの最適化機能が強化されることにより,CUDA コードを OpenCL に単純変換するだけでも,CUDA と同等の性能を達成できる可能性が示された.
著者
佐藤 功人 近藤 雄樹 清田 雄策
雑誌
研究報告システム・アーキテクチャ(ARC) (ISSN:21888574)
巻号頁・発行日
vol.2016-ARC-222, no.14, pp.1-7, 2016-09-29

データの保存に用いられる記憶媒体がディスク装置 (HDD) からフラッシュメモリ (SSD) へと移行し,Linux OS におけるストレージ装置のプロトコルスタックも従来の SCSI 規格に加えて SSD に特化した NVMe (Non-Volatile Memory Express) 規格が導入された.NVMe デバイスドライバでは,従来存在したマルチコア CPU で生じるコア間の排他制御競合によるボトルネックが解消されている.本報告では,高性能共有ストレージ装置へのアクセスインターフェースとして NVMe 規格を適用することで,ローカルの SSD と同様にボトルネックが解消することを定量的に示す.また,初期の NVMe デバイスドライバの実装方法では運用上のデメリットが発生するが,運用性を損なわずボトルネックを解消するために後に Linux に導入された,ブロックマルチキューについて述べる.