著者
西川 尚紀 岩井 啓輔 黒川 恭一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. CPSY, コンピュータシステム (ISSN:09135685)
巻号頁・発行日
vol.109, no.168, pp.49-54, 2009-07-28
被引用文献数
3

近年,GPUを用いた高性能計算が注目されている.GPUは,価格性能比に優れ,並列度の高いアプリケーションでは,安価なシステムで高い効果を発揮することができる.最近の世代のGPUでは整数・論理演算命令がサポートされ,同演算を用いたアプリケーションの実装が可能になった.本稿では,GPUを用いて暗号アルゴリズムDESに対するパスワードクラックを実装した結果について報告する.実装したプログラムでは,一度のジョブ発行で2^<35>乗個の鍵空間を探索することが可能である.DESの鍵空間に対しては,NVIDIA Geforce GTX 285を用いて約7.4時間,Intel Core i7-920 2.66GHzと比較して約9倍の速度で鍵探索が可能であった.その結果を元に,GPUの高速性を生かした暗号アルゴリズムに対するパスワードクラックの可能性を検討する.
著者
西川 尚紀 岩井 啓輔 黒川 恭一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. RECONF, リコンフィギャラブルシステム (ISSN:09135685)
巻号頁・発行日
vol.109, no.395, pp.107-112, 2010-01-19

並列計算プラットフォームとしてGPGPUが注目されており,CUDAがその開発環境として大きなシェアを占めるに至っている.CUDAではスレッド数やスレッドブロック数等のパラメータ決定はプログラマに責任があり,反復実験により最適値を求めているのが現状である.このため,我々は暗号処理のCUDA実装に対してスレッド数等を自動で最適化するモデルの構築を試みている.本稿では,その第一段階として,AESのCUDA実装に対し平文のデータ型,メモリ配置方法,計算粒度を変化させ,これらの条件がパフォーマンスに与える影響について分析を行った結果を示す.その結果,条件の違いにより最大6.6倍の性能差が生じ,(1)上限に近いスレッド数の確保よりもメモリアクセスの最適化を優先する実装が有効,(2)16Byte/Threadの計算粒度は4Byte/Thread,1Byte/Threadに対しGPUのパフォーマンスを引き出しやすい傾向にある,(3)平文のデータ型の違い,平文のメモリ配置方法,計算粒度がパフォーマンスに影響を与える,という知見が得られた.また,unsigned character及びarray of structureとして共有メモリに格納された平文に対して4Byte/Threadの計算粒度でのAES暗号化を行った場合にGPUの最大性能を引き出し,このときCore i7-920 2.66GHz CPU上での通常実装に対して約47倍の高速化が確認された.
著者
山岡香苗 岩井啓輔 田中秀磨 黒川恭一
雑誌
第76回全国大会講演論文集
巻号頁・発行日
vol.2014, no.1, pp.623-624, 2014-03-11

近年,兵器割当問題に関してさまざまなアプローチによる解法が提案されている.兵器割当問題とは,敵国による複数攻撃に対して,自国の保有する武器を最適に割り当てる問題である.本稿では,時間の経過とともに,敵国の攻撃機と自国の武器の残存数,互いの距離による武器の射撃範囲や命中率など刻々と変化していくダイナミックな問題を取り扱う.この時, T機の攻撃機に対してW箇所に配置した武器を割り当てるT×W個のバイナリニューロンから成るホップフィールド型のニューラルネットワークを用いて,戦況に応じた武器の割当を決定するアルゴリズムを提案し,シミュレーションにより最適解を評価する.
著者
五ノ井 賢一 黒川 恭一
雑誌
全国大会講演論文集
巻号頁・発行日
vol.54, pp.315-316, 1997-03-12

組み合わせ最適化問題に対して、ニューラルネットワークを用いた解法が多数提案されている。本稿においては、バイナリニューロンを用いた相互結合型ニューラルネットワークを使用した渡河問題に対する解法を提案する。この問題については、文献[1]にてニューラルネットワークを使用した解法を提案されている。本稿ではそれとは異なる構成法を示す。
著者
西川 尚紀 岩井 啓輔 黒川 恭一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. VLD, VLSI設計技術 (ISSN:09135685)
巻号頁・発行日
vol.109, no.393, pp.107-112, 2010-01-19

並列計算プラットフォームとしてGPGPUが注目されてり,CUDAがその開発環境として大きなシェアを占めるに至っている.CUDAではスレッド数やスレッドブロック数等のパラメータ決定はプログラマに責任があり,反復実験により最適値を求めているのが現状である.このため,我々は暗号処理のCUDA実装に対してスレッド数等を自動で最適化するモデルの構築を試みている.本稿では,その第一段階として,AESのCUDA実装に対し平文のデータ型,メモリ配置方法,計算粒度を変化させ,これらの条件がパフォーマンスに与える影響について分析を行った結果を示す.その結果,条件の違いにより最大6.6倍の性能差が生じ,(1)上限に近いスレッド数の確保よりもメモリアクセスの最適化を優先する実装が有効(2)16Byte/Threadの計算粒度は4Byte/Thread, 1Byte/Threadに対しGPUのパフォーマンスを引き出しやすい傾向にある,(3)平文のデータ型の違い,平文のメモリ配置方法,計算粒度がパフォーマンスに影響を与える,という知見が得られた.また,unsigned character及びarray of structureとして共有メモリに格納された平文に対して4Byte/Threadの計算粒度でのAES暗号化を行った場合にCPUの最大性能を引き出し,このときCore i7-920 2.66GHz CPU上での通常実装に対して約47倍の高速化が確認された.