著者
西川 尚紀 岩井 啓輔 黒川 恭一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. CPSY, コンピュータシステム (ISSN:09135685)
巻号頁・発行日
vol.109, no.168, pp.49-54, 2009-07-28
被引用文献数
3

近年,GPUを用いた高性能計算が注目されている.GPUは,価格性能比に優れ,並列度の高いアプリケーションでは,安価なシステムで高い効果を発揮することができる.最近の世代のGPUでは整数・論理演算命令がサポートされ,同演算を用いたアプリケーションの実装が可能になった.本稿では,GPUを用いて暗号アルゴリズムDESに対するパスワードクラックを実装した結果について報告する.実装したプログラムでは,一度のジョブ発行で2^<35>乗個の鍵空間を探索することが可能である.DESの鍵空間に対しては,NVIDIA Geforce GTX 285を用いて約7.4時間,Intel Core i7-920 2.66GHzと比較して約9倍の速度で鍵探索が可能であった.その結果を元に,GPUの高速性を生かした暗号アルゴリズムに対するパスワードクラックの可能性を検討する.
著者
西川 尚紀 岩井 啓輔 黒川 恭一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. RECONF, リコンフィギャラブルシステム (ISSN:09135685)
巻号頁・発行日
vol.109, no.395, pp.107-112, 2010-01-19

並列計算プラットフォームとしてGPGPUが注目されており,CUDAがその開発環境として大きなシェアを占めるに至っている.CUDAではスレッド数やスレッドブロック数等のパラメータ決定はプログラマに責任があり,反復実験により最適値を求めているのが現状である.このため,我々は暗号処理のCUDA実装に対してスレッド数等を自動で最適化するモデルの構築を試みている.本稿では,その第一段階として,AESのCUDA実装に対し平文のデータ型,メモリ配置方法,計算粒度を変化させ,これらの条件がパフォーマンスに与える影響について分析を行った結果を示す.その結果,条件の違いにより最大6.6倍の性能差が生じ,(1)上限に近いスレッド数の確保よりもメモリアクセスの最適化を優先する実装が有効,(2)16Byte/Threadの計算粒度は4Byte/Thread,1Byte/Threadに対しGPUのパフォーマンスを引き出しやすい傾向にある,(3)平文のデータ型の違い,平文のメモリ配置方法,計算粒度がパフォーマンスに影響を与える,という知見が得られた.また,unsigned character及びarray of structureとして共有メモリに格納された平文に対して4Byte/Threadの計算粒度でのAES暗号化を行った場合にGPUの最大性能を引き出し,このときCore i7-920 2.66GHz CPU上での通常実装に対して約47倍の高速化が確認された.
著者
西川 尚紀 岩井 啓輔 黒川 恭一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. VLD, VLSI設計技術 (ISSN:09135685)
巻号頁・発行日
vol.109, no.393, pp.107-112, 2010-01-19

並列計算プラットフォームとしてGPGPUが注目されてり,CUDAがその開発環境として大きなシェアを占めるに至っている.CUDAではスレッド数やスレッドブロック数等のパラメータ決定はプログラマに責任があり,反復実験により最適値を求めているのが現状である.このため,我々は暗号処理のCUDA実装に対してスレッド数等を自動で最適化するモデルの構築を試みている.本稿では,その第一段階として,AESのCUDA実装に対し平文のデータ型,メモリ配置方法,計算粒度を変化させ,これらの条件がパフォーマンスに与える影響について分析を行った結果を示す.その結果,条件の違いにより最大6.6倍の性能差が生じ,(1)上限に近いスレッド数の確保よりもメモリアクセスの最適化を優先する実装が有効(2)16Byte/Threadの計算粒度は4Byte/Thread, 1Byte/Threadに対しGPUのパフォーマンスを引き出しやすい傾向にある,(3)平文のデータ型の違い,平文のメモリ配置方法,計算粒度がパフォーマンスに影響を与える,という知見が得られた.また,unsigned character及びarray of structureとして共有メモリに格納された平文に対して4Byte/Threadの計算粒度でのAES暗号化を行った場合にCPUの最大性能を引き出し,このときCore i7-920 2.66GHz CPU上での通常実装に対して約47倍の高速化が確認された.