著者
荒井 勇亮 佐藤 功人 滝沢 寛之 小林 広明
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2010-HPC-124, no.11, pp.1-7, 2010-02-15

近年,従来の CUDA に加えて,GPGPU プログラミングのための新たな標準プログラミング環境として OpenCL が利用可能となった.本論文では,CUDA と OpenCL のプログラムの実行性能差を定量的に評価する.まず,ほぼ同等の処理を行う CUDA と OpenCL のプログラムを実装し,性能を比較する.次に,その性能差の主要因を調査し,CUDA コンパイラではサポートされているいくつかのコンパイラ最適化手法が,現在の OpenCL コンパイラではサポートされていないことを明らかにする.最後に,OpenCL コンパイラで生成されるコードを手動で最適化することによって CUDA と同等の性能を達成できた結果から,今後の OpenCL コンパイラの最適化機能が強化されることにより,CUDA コードを OpenCL に単純変換するだけでも,CUDA と同等の性能を達成できる可能性が示された.
著者
滝沢 寛之 小久保 達信 片海健亮 小林 広明
雑誌
情報処理学会論文誌コンピューティングシステム(ACS) (ISSN:18827829)
巻号頁・発行日
vol.46, no.SIG12(ACS11), pp.37-45, 2005-08-15

HPC Challenge(以下HPCC とする)ベンチマークは,高性能計算(High-Performance Computing,以下HPC)システムの総合的な性能評価のために提唱されているベンチマーク集である.現在までに広く用いられている浮動小数点演算性能に加えて,メモリアクセスやネットワーク通信の性能等,複数の観点から多角的にHPC システムを評価することにより,HPCC ベンチマークは実用的な科学技術計算に対する実効性能を適切に評価する指標として期待されている.本論文では,東北大学情報シナジーセンターで運用しているNEC SX-7 システムの性能をHPCC ベンチマークを用いて評価した結果について述べる.28 の評価項目のうち16 項目において著しく高い評価が得られた結果に基づいて,HPC 分野におけるベクトル型アーキテクチャの優位性について議論する.
著者
滝沢 寛之
出版者
東北大学
雑誌
若手研究(B)
巻号頁・発行日
2003

データクラスタリングのためには最近傍のクラスタ探索(最近傍探索)のために高次元ベクトル間の距離計算を多くの回数行う必要があり、大規模な問題に適用する場合にはその計算負荷が大きな課題となる。本研究では平成15年度に、近年のパーソナルコンピュータ(PC)用描画ハードウェア(GPU)の急速な発展に着目し、一般的なGPUを並列プロセッサとして利用すること(GPGPU)で高速な最近傍探索を実現した。さらに、平成16年度はその研究成果を応用して、GPUとCPUとの協調によりデータクラスタリングを高速に行う手法を開発した。この手法は最近傍探索距離の有する2種類の並列性を効果的に利用可能であり、その成果は国際会議において最優秀論文賞を受賞するなど学術的に非常に高く評価された。また、データクラスタリングに適用可能な競合学習をPCクラスタで効果的に並列実行する手法を提案し、その成果が国際学術論文誌に掲載された。データマイニングの重要な要素である可視化についても引き続き検討し、北海道大学-東北大学間のスーパーSINETによる接続実験により、可視化サーバを対話的に遠隔利用できることを実証実験した。物理的に遠隔地にある演算サーバを利用してクラスタリング処理やその後のボリュームレンダリング等の可視化処理を行い、データマイニングに利用可能であることが実証された。その成果は学術論文誌に掲載予定である。Chinrunguengらの手法は、部分歪みエントロピを用いてクラスタの最適性を評価することにより平均歪みを最小化する。しかし、適切なクラスタを形成するまでに多数回の繰返し計算が必要であり、時系列データの時間変化に対して迅速に追従できない可能性がある。本研究では、部分歪みエントロピに基づいて適切にクラスタを再配置する手法を新たに提案し、動画像の適応ベクトル量子化に適用することよって追従速度と歪み最小化性能との両立を実現できることを確認した。