著者
正田 備也 濱田 剛 柴田 裕一郎 小栗 清
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IE, 画像工学 (ISSN:09135685)
巻号頁・発行日
vol.108, no.324, pp.1-6, 2008-11-21

本論文では,LDA (latent Dirichlet allocation)言語モデルによる画像からの多重トピック抽出を,GPUを用いて高速化する手法を提案する.LDAはテキスト・マイニングのための確率モデルとしてBleiらにより提案されたが,近年,他のマルチメディア情報へも応用されている.そこで,本論文では,Wangの10,000 test imagesにLDAを適用し,多重トピック抽出をおこなう.LDAのためのパラメータ推定にはcollapsed変分ベイズ法を用いるが,Nvidia CUDA互換GPUを利用して推定を高速化する手法を提案する.
著者
正田備也 濱田 剛 柴田 裕一郎 小栗 清
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.88, pp.67-72, 2008-09-14

本論文では,latent Dirichlet allocation (LDA) のための collapsed 変分ベイズ推定を Graphics Processing Unit (GPU) を用いて高速化する方法を提案する. LDA は,ベイズ理論に基づくマルチトピック文書モデルとして知られているが, Expectation-Maximization (EM) アルゴリズムが利用可能な probabilistic latent semantic indexing (PLSI) など他の文書モデルに比べ,パラメータ推定が複雑で膨大な計算を要する.そこで, LDA のための deterministic なパラメータ推定方法として優れている collapsed 変分ベイズ推定を, GPU を用いて高速化した.実験では約 500 万組の文書と単語のユニークなペアについて, 1 つの Nvidia GeForce 8800 GT 上で collapsed 変分ベイズ推定を実行, 20 Gflops の計算速度を得た.In this paper, we propose a method for executing collapsed variational Bayesian inference for latent Dirichlet allocation (LDA) on Graphics Processing Unit (GPU). While LDA is a well-known multi-topic document model based on Bayesian methods, it requires complicated inference, which leads to enormous computations in comparison with other document models, e.g. probabilistic latent semantic indexing (PLSI), to which Expectation-Maximization (EM) algorithm is applicable. Therefore, we accelerate collapsed variational Bayesian inference, known as an efficient deterministic inference method for LDA, by using GPU. In the experiments, we used about 5 million unique pairs of documents and words. We achieved 20 Gflops on a single Nvidia GeForce 8800 GT.
著者
伊吹山 秋彦 濱田 剛 中里 直人 奥山 祐市
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. RECONF, リコンフィギャラブルシステム (ISSN:09135685)
巻号頁・発行日
vol.106, no.247, pp.7-12, 2006-09-08
被引用文献数
9

2次元Kolmogorov Smirnovテスト(KSテスト)[3],[5]は,2つの2次元分布が同じであるか,あるいはどの程度異なっているかを評価する手法である.KSテストは計算量がデータ数の2乗のオーダで増加するため,これまで応用事例は限られたものしかなかった.今回,我々は2次元KSテストの最も計算時間を要する部分が粒子シミュレーションの粒子間相互作用のかたちで表すことができることに着目し,PROGRAPE-4ボードを用いて高速に実行することに成功した.本稿ではPROGRAPE-4による2次元KSテストの実装の詳細と性能評価を示すとともに,天体物理学分野での応用例を示す.
著者
中里 直人 濱田 剛
雑誌
情報処理学会論文誌コンピューティングシステム(ACS) (ISSN:18827829)
巻号頁・発行日
vol.47, no.SIG7(ACS14), pp.162-171, 2006-05-15

天体物理学では重力多体問題専用計算機GRAPE が非常に大きな成果をあげてきた.本論文では,演算機能が固定されているというGRAPE 計算機の欠点を解消すべく,Field Programmable GateArray(FPGA)を利用した計算機上で,浮動小数点演算を実行し天体物理学計算の高速化を行った.我々が開発したFPGA に浮動小数点演算による演算回路を実装するためのソフトウエアPGR を使用し,重力多体問題を大幅に高速化できることだけでなく,世界で初めてSPH 法の専用計算機による高速化に成功した.本論文の結果は,FPGA による浮動小数点演算の実用性を実証している.
著者
松尾 堅太郎 三好 正之 濱田 剛 柴田 裕一郎 正田 備也 小栗 清
出版者
一般社団法人映像情報メディア学会
雑誌
映像情報メディア学会技術報告 (ISSN:13426893)
巻号頁・発行日
vol.33, no.6, pp.201-206, 2009-02-04
参考文献数
9

位相限定相関法は画像マッチング・画像レジストレーションにおいて高いロバスト性とサブピクセル単位での高い精度を実現する計算方法であるが同時に計算コストが膨大であるという側面もある.これまで位相限定相関法の高速化には専用LSIやFPGAを用いた方法が試みられてきた.今回我々は新たにGPU(Graphics Processing Unit)を用いた位相限定相関法の高速化手法を考案し,Nvidia GPU,GeForce8800GTSへ実装を行った.GPU 1台当たりの処理時間に256×256 pixel画像が2.36秒,512×512 pixel画像が7.92秒,1024×1024 pixel画像が27.65秒で処理可能なことを確認し,これが過去の専用LSIやFPGAを用いた場合の計算速度と比較して約10倍程度高速であることを確認した.
著者
濱田剛
雑誌
研究報告計算機アーキテクチャ(ARC)
巻号頁・発行日
vol.2012-ARC-199, no.12, pp.1-24, 2012-03-20

本論文では AMD/ATI Radeon HD 5870 を用いた GPU クラスタである DEGIMA における LINPACK ベンチーマーク消費電力性能について評価結果を紹介する.HD 5870 GPU はプログラム実行中に電圧・動作周波数を調整することが可能である.DEGIMA では LINPACK ベンチマーク実行中に電圧・周波数の調整を行わなかった場合 1.4698 GFlops/Watt であったものが,電圧・周波数の動的な調整を行った場合には 1.9658 GFlops/Watt まで向上することを確認した.