文献一覧: 佐藤三久 (著者)

16 0 0 0 OA GPUクラスタにおけるGPU/CPUハイブリッド・プログラミング環境

著者: 小田嶋哲哉李珍泌朴泰祐佐藤三久塙敏博児玉祐悦 RaymondNamyst SamuelThibault OlivierAumage
雑誌: 研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日: vol.2012-HPC-135, no.9, pp.1-8, 2012-07-25

GPU クラスタ上でのプログラミングは,様々なプログラミングフレームワークが直交しており,複雑になってしまうことが多い.本研究では,XMP をアクセラレータを持つ並列計算機向けに拡張した言語仕様 XMP-dev の一実装として,GPU と CPU によるハイブリッドワークシェアリングを容易に行うことができる XMP-dev/StarPU を提案し,プロトタイプ実装を行う.XMP-dev は,XMP が本来提供している分散メモリノードへのデータと処理の分割・通信の機能に加え,各ノードでの処理の一部を GPU にオフローディングをすることが可能である.しかし,現在の実行モデルでは GPU にオフロードされた部分はすべて GPU により実行され,CPU との協調計算やワークシェアリングを行うことができない.本研究では,StarPU をバックエンドスケジューラとして用い,計算をタスクという単位で GPU や CPU へスケジューリングをすることで,GPU / CPU のワークシェアリングを可能とする.本稿では,現在開発中の XMP-dev/StarPU のプロトタイプコンパイラと同等の動作をするハンドコンパイルしたコードを用いて重力 N 体問題について評価を行う.結果として,GPU/CPU ワークシェアリングは機能しているが性能向上は十分ではなく,大きな要因は GPU と CPU の性能差に対応する十分な問題サイズを与えることが難しいこと,また,これを改善するために何らかの負荷バランス機能が必要であることがわかった.

http://id.nii.ac.jp/1001/00083286/

3 0 0 0 OA 融合型並列計算機による宇宙第一世代天体の起源の解明

著者: 梅村雅之中本泰史朴泰祐高橋大介須佐元森正夫佐藤三久
出版者: 筑波大学
雑誌: 特別推進研究
巻号頁・発行日: 2004

宇宙第一世代天体の誕生は、宇宙全体の進化、銀河の誕生、重元素の起源を解き明かす上で根源的な問題である。本計画の目的は、宇宙第一世代天体形成過程について、超高精度のシミュレーションを行い、その起源を解き明かすことにある。そのために、天体形成シミュレーションの専門家と計算機工学の専門家が、緊密な協力体制の下に重力計算専用ボードBlade-GRAPEを開発し、これをPCクラスタに融合させた宇宙シミュレータFIRSTを開発した。FIRSTは、256の計算ノード、496CPUからなり、2つのファイルサーバをもつ。また、分散したローカルディスクから一つの共有ファイルシステムを構築するGfarmシステムが導入されており、総計22TBのファイルシステムをもつ。FIRSTの総演算性能は、36.1TFLOPSであり、内ホスト部分3.1TFLOPS、Blade-GRAPE部分33TFLOPSである。また、主記憶容量は総計1.6TBである。このような融合型並列計算機の開発は、世界でも例を見ないものである。FIRSTを用いてこれまでにない大規模なシミュレーションを実行した。その結果、次のような成果を得た。(1)宇宙第一世代天体形成のダークマターカスプに対する依存性の発見、(2)初代星に引き続いて起こる星形成への輻射性フィードバックの輻射流体計算とフィードバック条件の導出、(3)紫外線輻射場中の原初星団形成シミュレーションによる球状星団形成の新たな理論モデルの提唱、(4)3次元輻射輸送計算による原始銀河からの電離光子の脱出確率の導出、(5)銀河団合体時の非平衡電離過程効果の発見、(6)アンドロメダ銀河と衛星銀河の衝突による“アンドロメダの涙"のモデル提唱。中でも(1)は、過去の他グループの計算に比べて2桁以上高い質量分解能を実現することによってもたらされたものである。この計算によって、従来の第一世代天体に対する描像に見直しが必要であることが明らかとなった。

2011-07-23 01:37:41
3 + 0 Twitter

https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-16002003/

2 0 0 0 UDPによるファイアウォール越えを用いたP2Pオーバーレイネットワーク

著者: 岡本高幸朴泰祐佐藤三久建部修見
出版者: 一般社団法人情報処理学会
雑誌: 情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:09196072)
巻号頁・発行日: vol.2006, no.87, pp.121-126, 2006-07-31

家庭やオフィスの遊休PCは潜在的に大きな計算能力を有しており,これらを接続して効率的に利用することができれば非常に大きな計算資源となる.しかし,NATやファイアウォールの中にあるこれらのPCを相互に接続するには,物理的なIPアドレスに依存しないノード識別子によるルーティング処理やUPnP,hole punchingなどのNAT越えの技術が必要である.これらをアプリケーションごとに実装していくことは煩雑であり,P2Pアプリケーションの開発における問題となっている.そこで本稿では,アプリケーションをネットワークの物理構成から独立させ,物理ネットワークに依存せず参加するすべてのノードを等しく接続可能とするオーバーレイネットワークを提案する.そして,その実現に必要なNAT越え技術の一つであるUDP hole punchingについてのテストシステムを作成し,市販の家庭用ルータを用いて性能評価を行った.UDP hole punchingと独自のライブラリを使うことによってTCPと比べて2 割程度のスループットの低下でNATを越えて直接通信が実現できることを確認した.An enormous number of PCs at home or office potentially implies a great amount of computation power when they are out of the work, and there is an opportunity to utilize their power for a large scale computation. However, these machines usually exist behind the NAT or firewall and it requires various techniques to access and connect them, such as logical naming independent from the original IP addresses, efficient routing, or NAT traversing with UPnP or UDP hole punching. It is troublesome to apply these techniques adequately to each application, and this is a hazard in the development of P2P application. In this paper, we propose an overlay network to connect all attending nodes in logically flat layer independently from their physical network in order to encourage the easy development of various P2P applications. In our system, we implement a generic communication library based on UDP hole punching which is one of the most common NAT traversal techniques, and evaluated the communication performance on commodity personal broadband router widely used at home. We developed an original communication layer only with UDP protocol which is basically compatible with TCP. By the direct communication through NAT box without intermediate relay server, we confirmed that our method provides a communication performance with only about 20% of performance degradation compared with TCP communication.

2011-05-16 19:30:13
2 + 1 Twitter

https://ci.nii.ac.jp/naid/110004821220

2 0 0 0 匿名相互証明書とP2P通信を用いる認証方式

著者: 平野基孝首藤一幸田中良夫佐藤三久
出版者: 一般社団法人情報処理学会
雑誌: 情報処理学会研究報告システムソフトウェアとオペレーティング・システム(OS) (ISSN:09196072)
巻号頁・発行日: vol.2005, no.79, pp.17-24, 2005-08-03
被引用文献数: 2

我々は数千ノードからなるP2P、グリッド等の大規模並列分散コンピューティング用の安全な通信基盤の形成を目的として、匿名相互証明書とP2P通信を用いる認証方式AUBReX(Authentication method Using Buddy-buddy relationship Represented by Cross centificate)を提案する。AUBReXでは、2ユーザ間(友人)の信頼関係を、そのユーザ間以外では個人情報の特定が出来ないように生成されたエンドエンティティ名(SubjectDN内のCommonName)を持つX.509デジタル証明書を相互に発行しあうことで表現する。これを匿名相互証明書と呼び、匿名相互証明書からなる証明書チェインをP2P通信により生成、検査することで、直後の信頼関係を結んでいないユーザ間での、匿名性を確保した上でのユーザ認証機構を提供する。AUBReXを用いることで、中央集権的CAを必要とせず、かつ不特定多数のユーザ間でのPKIベースの相互認証が可能になり、P2P環境でのピア間相互認証に有効である。We propose an authentication method called AUBReX(Authentication method Using Buddy-buddy relationship Represented by Cross certificate),which enables a secure communication infrastructure of a thousand of nodes for P2P and Grid distributed parallel computing using anonymous cross certificates and P2P communication. In the AUBReX,a trusted relationship (fellowship,or buddy-buddy relationship) between two users is represented by issueing X.509 cross certificate each other. The cross certificate has a secure-hashed CommonName as an end entity,that can only be revealed between the users. By collecting such anonymous cross certificates via P2P connection and generating a certificate chain and verifying it, the AUBReX provides an authentication mechanism between users who don`t have direct turusted relationship. By using AUBReX,it enables that PKI based mutual authentication between any users without a centralized CA,in which is suitable for P2P environment.

2008-11-19 18:55:10
2 はてなブックマーク

https://ci.nii.ac.jp/naid/110002952230

1 0 0 0 OA GPUクラスタ向け並列言語XMP-devにおけるGPU/CPU協調計算

著者: 小田嶋哲哉李珍泌朴泰祐佐藤三久塙敏博児玉祐悦 RaymondNamyst SamuelThibault OlivierAumage
雑誌: 研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日: vol.2013-HPC-138, no.25, pp.1-9, 2013-02-14

GPU クラスタ上でのプログラミングは,様々なプログラミングモデルが直交しており,複雑になってしまうことが多い.本稿では,分散メモリ環境向け高水準並列プログラミング言語である XMP を GPU クラスタ等のアクセラレータを持つ並列計算機向けに拡張した言語仕様 XMP-dev において,GPU と CPU によるハイブリッド協調計算を実現する XMP-dev/StarPU を提案,実装を行った.XMP-dev は,ノード間通信をベースとし,データの分散や GPU へのオフローディングが可能な並列言語である.しかし,CPU を計算リソースとして GPU と並行して用いるには複雑なプログラミングが必要である.これに対し,StarPU をバックエンドのスケジューラとすることで,計算をタスクという単位で GPU や CPU へスケジューリングすることによりワークシェアリングが可能になる.本稿では,実際のアプリケーションに XMP-dev/StarPU を適用することで,GPU のみを計算に利用するときよりも 1.1~1.2 倍ほどの高速化が可能であることを示した.また,指示文ベースのプログラミングモデルである XMP-dev/StarPU は,通常のプログラミングよりもコストが大幅に削減できることも示した.

2022-06-29 19:58:09
1 + 0 Twitter

http://id.nii.ac.jp/1001/00090201/

1 0 0 0 OA Extreme SIMDアーキテクチャのプログラミングモデル拡張Cによる性能評価

著者: 宇川斉志佐藤三久朴泰祐児玉祐悦山口佳樹山本淳二
雑誌: 研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日: vol.2015-HPC-148, no.24, pp.1-8, 2015-02-23

エクサスケールの計算機の実現にあたって文部科学省の委託研究により大量の演算器を 1 つのマスタープロセッサで制御する Extreme SIMD アーキテクチャが提案された.本稿では Extreme SIMD アーキテクチャ上で実行できるバイナリを生成するためのプログラミングモデルの一つとして Extreme SIMD 向け拡張 C について述べ,それを用いて Extreme SIMD アーキテクチャのシミュレータによる評価を行う.Extreme SIMD 向け拡張 C は PE で実行される文を SIMD 制御文で囲むだけで簡単に指定することが可能で,メモリ操作などはライブラリ関数で提供されるという特徴を持つ.2 次元のラプラス方程式の差分法による計算を実行したところローカルメモリに入りきる 4096×4096 格子の問題サイズではピーク性能に対して最大 74%と高い実効効率を示すが,入りきらない問題サイズでは実効効率が 1 割未満になるという急激な性能低下を起こすことを確認した.

2022-05-19 10:26:26
1 + 2 Twitter

http://id.nii.ac.jp/1001/00113229/

1 0 0 0 複数クライアントによるLAN/WANでのNinfの性能

著者: 竹房あつ子小川宏高松岡聡中田秀基高木浩光佐藤三久関口智嗣長嶋雲兵
出版者: 一般社団法人情報処理学会
雑誌: 情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日: vol.39, no.6, pp.1827-1838, 1998-06-15
参考文献数: 14

広域ネットワークの整備につれ,高性能広域分散計算を実現する試みが我々のNinfを含めていくつか行われている.しかしこのような広域計算システムの,特にWANにおいて複数のクライアントが複数のサイトに分散している状況下での性能特性に関する議論は十分になされていない.本稿では,Ninfおよび類似のシステムの実現可能性を調査するため,LAN/WAN環境でLinpack/EPベンチマークを実施し,次のような結果を得た.1)十分なバンド幅があれば,Ninfを用いた方がLocal実行するより高速になる.2)既存の高性能計算機は性能や耐久性の点で広域計算システムの運用に十分なプラットフォームである.3)ベクトル並列計算機(Cray J90)では,高性能並列ライブラリが有効利用できる,すなわち既存の高性能ライブラリの再利用性がある.4)計算主体の計算(EP)では現状の広域計算システムで十分に運用できる.5)通信主体の計算(Linpack)では,LAN環境ではサーバの稼働率が性能を支配し,WAN環境では通信性能と設置条件によって性能に与える影響に一定の傾向がある.Rapid increase in speed and availability of network of supercomputers is making high-performance global computing possible,including our Ninf system.However,critical issues regarding system performance characteristics in global computing have been little investigated,especially under multi-client,multi-site WAN settings.In order to investigate the feasibility of Ninf and similar systems,we conducted benchmarks under various LAN and WAN environments,and observed the following results:1)Given sufficient communication bandwidth,Ninf performance quickly overtakes client local performance,2)current supercomputers are sufficient platforms for supporting Ninf and similar systems in terms of performance and OS fault resiliency,3)for a vector-parallel machine (Cray J90),employing optimized dataparallel library is a better choice compared to conventional task-parallel execution employed for non-numerical data servers,4)computationally intensive tasks such as EP can readily be supported under the current Ninf infrastructure,and 5)for communication-intensive applications such as Linpack,server CPU utilization dominates LAN performance,while communication bandwidth dominates WAN performance,and furthermore,aggregate bandwidth could be sustained for multiple clients located at different Internet sites;as a result,distribution of multiple tasks to computing servers on different networks would be essential for achieving higher client-observed performance.

2020-07-22 09:23:26
1 + 1 Wikipedia

https://ci.nii.ac.jp/naid/110002722197

1 0 0 0 Javaによる大域的並列計算環境Ninflet

著者: 高木浩光松岡聡中田秀基関口智嗣佐藤三久長嶋雲兵
出版者: 一般社団法人情報処理学会
雑誌: 情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日: vol.40, no.5, pp.2203-2214, 1999-05-15
参考文献数: 23
被引用文献数: 1

地球規模の広域分散計算システムを魅力的なものとするためには不特定の者に対してシステムの利用だけでなく応用プログラムの作成をも解放する必要があると考える. その実現のためには安全性を保証しながら任意のプログラムを実行できる仕組みが必要である. そこで Javaのセキュリテイ機構を活用してこれを実現した大域的並列計算環境「Ninflet」を提案する. これを用いることで任意の計算を他人が所有する計算機上でさせることが可能となる. このシステムは夜間利用されていない計算機を地球の裏側の昼間の地域に貸し出すといった地球規模の共同利用メタコンピュータシステムを実現するためやまたワークステーションクラスタ上に並列処理環境を構築するためにも利用することのできるものである. 本論文では Ninfletシステムのアーキテクチャを提案するとともに並列処理環境として利用する場合の予備的な性能評価を行う.To make global-wide distributed computing system attractive, the system should be open to an arbitrary individual not only for its usage but also for construction of wide variety of application programs. For this purpose, the system must supply a secure environment for safely executing arbitrary programs. Our proposed global computing environment "Ninflet" fulfills such a requirement by exploiting the security mechanism of the Java language, allowing computation to occur on machines not owned or administered by the individual invoking the computation. Ninflet realizes a globally-shared metacomputer which would allow "lending" of computing cycles of machines which would be otherwise unused at nights to the other side of the globe, or to simply build a parallel execution environment on a heterogeneous sets of workstation clusters. We present the system architecture of Ninflet and a preliminary performance evaluation when used as a parallel execution environment.

2020-07-22 09:23:26
1 + 1 Wikipedia

https://ci.nii.ac.jp/naid/110002724966

1 0 0 0 Ninfによる広域分散並列計算

著者: 中田秀基高木浩光松岡聡長嶋雲兵佐藤三久関口智嗣
出版者: 一般社団法人情報処理学会
雑誌: 情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング]
巻号頁・発行日: vol.65, pp.9-14, 1997-03-06
参考文献数: 5

ローカルなネットワーク上でのメッセージバッシングライブラリを用いた分散並列計算はすでに広く行なわれている。しかし、ネットワークの高速化によって現実的になりつつある広域ネットワーク上での分散並列計算については、ソフトウェアの枠組が未だ十分に整備されていない。我々は、広域分散並列計算に適した分散計算の枠組として「Ninf」を提案している。Ninfは広域分散環境でのマクロデータフローによる並列実行を支援するシステムで、広域での動的負荷分散とスケジューリングを特徴とする。メッセージパッシングライブラリを用いた手法に比較して(1)広域ネットワークに適した通信パターンを用いる、(2)ユーザにとってプログラミングが容易でかつ再利用性が高い、(3)既存のライブラリの再利用が容易、(4)ネットワーク上の食源の利用が可能、といった特長をもっている。

2020-07-22 09:23:26
1 + 1 Wikipedia

https://ci.nii.ac.jp/naid/110002932007

1 0 0 0 Ninfによる広域分散並列計算

著者: 中田秀基高木浩光松岡聡長嶋雲兵佐藤三久関口智嗣
出版者: 一般社団法人情報処理学会
雑誌: 情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日: vol.39, no.6, pp.1818-1826, 1998-06-15
参考文献数: 7
被引用文献数: 4

ローカルなネットワーク上でのメッセージパッシングライブラリを用いた分散並列計算はすでに広く行われている.しかし,ネットワークの高速化によって現実的になりつつある広域ネットワーク上での分散並列計算については,ソフトウェアの枠組みがいまだ十分に整備されていない,我々は,広域分散並列計算に適した分散計算の枠組みとして「Ninf」を提案している.Ninfは広域分散環境でのマクロデータフローによる並列実行を支援するシステムで,広域での動的負荷分散とスケジューリングを特徴とする.メッセージパッシングライブラリを用いた手法と比較して,(1)広域ネットワークに適した通信パターンを用いる,(2)ユーザにとってプログラミングが容易でかつ再利用性が高い,(3)既存のライブラリの再利用が容易,(4)ネットワーク上の資源の利用が可能,といった特長を持つ.Distributed computing using message passing libraries in a LAN(Local Area Network) environment is already accepted as an effective supercomputing methodology.On the other hand,although distributed computing in WAN(Wide Area Network) environment is becoming practical due to recent development of high-speed network facilities,software framework for supercomputing in WAN is yet to be established.We propose 'Ninf',a distributed computing framework for globally distributed computing environment.Ninf enables parallel computing in WAN based on the macro dataflow model,and facilitates automatic dynamic load distribution and scheduling.Ninf has the following advantages over using existing message passing libraries in WAN supercomputing:(1) communication protocol suited for globally distributed environment,(2) ease of programming (3) reuse of existing libraries,(4) integration with existing data resources on the Internet.

2020-07-22 09:23:26
1 + 1 Wikipedia

https://ci.nii.ac.jp/naid/110002722196

1 0 0 0 PEZY-SC向けOmni OpenACCコンパイラの設計・試作

著者: 田渕晶大木村耕行鳥居淳松古栄夫石川正朴泰祐佐藤三久
雑誌: 研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:21888841)
巻号頁・発行日: vol.2016-HPC-154, no.3, pp.1-7, 2016-04-18

電力当たりの性能が重要視される中,低消費電力のアクセラレータとして PEZY-SC が注目されている.PEZY-SC のプログラミングには OpenCL をベースとした PZCL が提供されているが,その記述は煩雑で生産性が低い.そこでアクセラレータ向けの指示文ベースプログラミングモデルである OpenACC のコンパイラを PEZY-SC 向けに設計・試作する.Suiren Blue (青睡蓮) を用いた評価では,OpenACC コードは PZC Lコードと比較して N-Body では 98%以上,NPB CG では最大 88%の性能が得られた.また OpenACC は指示文を用いた簡潔な記述により PZCL の半分以下のコード行数で実装できたことから,高い生産性と十分な性能を達成できた.

2017-12-25 09:16:43
1 + 1 Twitter

http://id.nii.ac.jp/1001/00158459/

1 0 0 0 軽量スレッドライブラリArgobotsによるPGAS言語XcalableMPの動的タスク並列機能の設計

著者: 津金佳祐中尾昌広李珍泌村井均佐藤三久
雑誌: 研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:21888841)
巻号頁・発行日: vol.2016-HPC-155, no.29, pp.1-8, 2016-08-01

近年,高性能計算分野においてチップ内に多くのコアを搭載するメニーコアプロセッサを用いた大規模並列システムが登場している.そのようなシステムにおける並列化手法の一つとしてタスク並列が注目されており,本稿では,分散メモリ環境上での動的なタスク並列処理をより簡易な記述で実装可能とすべく PGAS 言語 XcalableMP(XMP) の拡張を行う.記述として tasklet 指示文を提案し,ノード内/外におけるタスク間の依存関係の記述による細粒度な同期や,通信と計算のオーバラップによる性能向上を目指す.タスク生成や制御は Argonne National Laboratory(ANL) により開発が進められている軽量スレッドライブラリである Argobots を用いる.現在は,実装対象である Omni XMP Compiler のランタイムのみの実装であるため,コード変換は手動で行う.提案手法の予備評価としてブロックコレスキー分解のコードを対象とし,性能・生産性の評価を行った.比較対象は,MPI+OpenMP による実装と INRIA によって開発が進められている StarPU による実装である.StarPU 実装との比較では一部優位な点が見られたが,MPI+OpenMP 実装との比較では最大で約 15%の性能低下が見られた.生産性の比較では,指示文による記述を採用したことによりベースコードから少ない変更で実装可能なことから,tasklet 指示文による記述の生産性の高さを示した.

2016-08-04 02:49:46
1 + 0 Twitter

http://id.nii.ac.jp/1001/00174109/

1 0 0 0 片方向通信の実装方式の違いによる比較

著者: 堀敦史李珍泌佐藤三久
出版者: 情報処理学会
雑誌: 研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:09196072)
巻号頁・発行日: vol.2010, no.12, pp.1-8, 2010-07-27

片方向通信は,ハードウェアによる RDMA (Remote Direct Memory Access) と相性が良く,高い通信性能を実現できる方式として注目されている.本稿では,片方向通信をソフトウェアで実装する際のポイントを挙げ,既存の片方向通信ライブラリである ARMCI と GASNet について実装方式を調査した.その結果,RDMA を用いずにメッセージ通信を下位レベルの通信レイヤーとして片方向通信が実現できること,RDMA を用いた場合の実装に比べ実装が容易であること,さらに RDMA 方式に劣らない性能を発揮する可能性があることを示す.また実際にこの方式による片方向通信ライブラリ Telemem を開発し,RDMA を用いた片方向通信ライブラリである ARMCI と性能をベンチマークプログラムを通じて比較し,Telemem の性能が ARMCI を上回る場合があることを示す.One-sided communication is thought to have an affinity with Remote Direct Memory Access (RDMA) done by a network interface hardware, and is attracting attentions as a way of implementing scalable high-performance communication system. In this paper, some points to a implement one-sided communication system will be listed and then it will be pointed out that a one-sided communication system without using RDMA but having low-level message communication layer can be implemented easily, avoiding some of the implemenation issues. The proposed one-sided communication system is implemented and named "Telemem," and evaluated with ARMCI one-sided communication system using RDMA. Through the benchmark evaluations, it will be shown that the application performance with Telemem may overcome the performance with ARMCI.

2012-09-11 21:33:59
1 + 0 Twitter

https://ci.nii.ac.jp/naid/110007995500

1 0 0 0 並列言語XcalableMPのGPU向け拡張

著者: 小田嶋哲哉チャントゥァンミン李珍泌朴泰祐佐藤三久
出版者: 情報処理学会
雑誌: 研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:21862583)
巻号頁・発行日: vol.2011, no.12, pp.1-8, 2011-03-08

高い演算性能及びメモリバンド幅をもつGPUを搭載したGPUクラスタが高性能計算プラットホームとして広く利用されている.GPUクラスタではプログラミングが非常に複雑になることや,計算負荷がGPUまたはCPUのどちらかに偏り,計算リソース全体を有効利用しにくいという問題がある.そこで,分散メモリシステム向けの並列言語であるXcalableMPをGPU向けに拡張して,GPUクラスタ等のヘテロジニアス環境に適応させることを検討する.本稿ではその予備評価として,XcalableMPによるGPU/CPU協調計算を行い,典型的なHPCアプリケーションであるN体問題と行列積計算を対象に,GPUとCPUへの計算負荷分散による最適化を行い,これらによる協調計算の可能性を検討した.その結果,2ノード・2GPUのシステム上でGPUに割り当てるデータを50%から60%にしたところ,最大で約1.7倍の高速化を得ることができた.As shown in TOP500 List at November 2010, GPU clusters have been recognized as highly cost-effective HPC resources. However, the programming on GPU cluster requires much harder effort than ordinary PC clusters because of complicated heterogeneous coding with combination of CUDA/OpenCL, OpenMP and MPI, for example. In order to provide a solution for this, we will consider an extension of parallel programming language XcalableMP for GPU cluster computing. In this paper, we propose an textended notation of XcalableMP for data and process distribution in a GPU cluster. We also preliminarily evaluate the performance enhancement by a cooperated computing with GPU and multi-core CPU on typical HPC applications, N-body calculation and matrix multiplication. As a result, we confirmed the maximum of 1.7 times higher performance when we distribute the 50 to 60% of computation to GPU, compared with the case with 100% of computation only by GPU.

2012-02-14 15:45:02
1 + 0 Twitter

https://ci.nii.ac.jp/naid/110008583342

1 0 0 0 PGAS言語XcalableMPのmulti-node GPU向け拡張仕様の実装と評価

著者: TranMinhTuan 李珍泌小田嶋哲哉朴泰祐佐藤三久
雑誌: 研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日: vol.2011, no.53, pp.1-8, 2011-07-20

GPU アーキテクチャの汎用化と高速化によって,GPU クラスタは高いコストパフォーマンスと演算性能,省電力化を HPC 分野にもたらしている.これまで汎用計算における GPU の高速化効果を目的とするプログラミング言語モデルの拡張やライブラリが数多く提案されてきた.しかし,これらは GPU を搭載するシングルノード環境を対象とする拡張が多く,GPU クラスタなどのメモリ分散システムを対象とするものがまだ少ない.multi-node GPU クラスタにおける高い性能プログラミングは通常の 1 ノード内のホストーGPU の拡張だけでは不十分,それぞれのノードにまたがる GPU どうしのプログラミングも意識する必要がある.そこで,現在,我々は Partitioned Global Address Space(PGAS) プログラミングモデルをベースとした並列プログラミング言語 XcalableMP を GPU クラスタに適用可能とするための拡張を行っている.本稿では,行列積計算を対象に,GPU クラスタにおける XMP-ACC 拡張のプログラミングコストと性能について調査した.その結果,4 ノードの GPU クラスタにおいて,CPU のみを用いた XcalableMP プログラムよりも,それに数行の XMP-ACC 指示文の追加したプログラムのほうが約 42 倍の速度向上が得られた.

2012-01-13 10:33:50
1 + 0 Twitter

https://ci.nii.ac.jp/naid/110008583409

1 0 0 0 大容量分散コンピューティングのための大規模スケーラブルP2Pグリッド基盤の研究

著者: 佐藤三久朴泰祐建部修見天笠俊之櫻井鉄也山本有作高橋大介北川博之
出版者: 筑波大学
雑誌: 基盤研究(A)
巻号頁・発行日: 2005

P2Pグリッドとは、従来、各研究組織にある計算資源を共有することが目的であったグリッド技術を、P2P技術を活用しオフィスおよび個人のPCなどの潜在的な計算資源をグリッドの計算資源として活用するものである。本研究の目的は、期待される大量の計算資源による大容量コンピューティングのためのP2Pグリッド基盤を構築・利用する技術を確立し、その有効性を検証することである。1. P2P環境の潜在的な計算資源をグリッドの計算資源として活用するために、多くのPCで利用されているWindowsにおいてLinuxバイナリを実行するためのシステムBEEとUDPによるファイアウォール越えを用いたP2Pオーバーレイネットワークを開発した。さらに、P2P環境における認証機構として、匿名相互証明書とP2P通信を用いる認証方式AUBReX、他のジョブスケジューラと相互に協調し資源を共有する機構について開発した。2. 大容量コンピューティングのプログラミングモデルとして、RPCモデルから広域ネットワーク上の大容量データを効率的に扱うためのデータレイヤOmniStorageを開発し、それを拡張し、多数のノードに分散配置された大量データに対して、グローバルなデータ並列操作を行うプログラミング環境を提案した。また、大規模スケーラブルP2PにおけるXMLデータ管理について、MLデータの内容による検索に着目し,P2Pネットワーク上でXMLデータのキーワード検索を可能にする手法を考案した。3. P2Pグリッド向きのアルゴリズムとして、複素積分を用いた非線形固有値計算アルゴリズムや前処理手法を開発した。また、P2Pグリッドの有望な高性能な計算資源として、ヘテロジーニアスマルチコアであるCellプロセッサを取り上げ、この資源を利用するための数値計算ソフトウエアを実装した。

2011-02-24 13:35:14
1 + 0 Twitter

https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-17200002/

1 0 0 0 ItaniumプロセッサによるSCoreクラスタ構築に関する検討

著者: 石川裕高橋大介朴泰祐佐藤三久
出版者: 一般社団法人情報処理学会
雑誌: 情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] (ISSN:09196072)
巻号頁・発行日: vol.92, pp.1-6, 2002-10-25
被引用文献数: 1

4台の4 way Itanium(800MHz)プロセッサから構成されるクラスタ上にSCoreクラスタシステムソフトウエアを移植し、ItaniumによるSCoreクラスタの性能を測定する。Pentium-III(933MHz)プロセッサによるクラスタと比較した結果、姫野ベンチマークでは、単体性能でItaniumプロセッサはPentium IIIプロセッサの3倍の性能がある。NAS並列ベンチマークのCGの結果では、16プロセッサ構成までの比較で、ItaniumプロセッサはPentium IIIプロセッサの2.7倍〜1.3倍高速である。

2010-04-15 01:00:09
1 はてなブックマーク

https://ci.nii.ac.jp/naid/110002978594

1 0 0 0 オープンなセンサを共有するセンシングWebのための広域分散アーキテクチャ

著者: 神林亮佐藤三久
出版者: 一般社団法人情報処理学会
雑誌: 情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:09196072)
巻号頁・発行日: vol.2008, no.74, pp.229-234, 2008-07-29

建物や街中,道路や駅構内といったさ様々な場所に,カメラや赤外線センサ,マイクなどのセンサデバイスが設置されつつあり,それらをネットワークで結びつけて活用する技術が期待されている.センシング Web は,クローズドなネットワークのみならず,広域ネットワークに接続されたオープンなセンサ群を接続して社会全体で共有利用を行おうとするプロジェクトである.センシング Web では,従来の単純なセンターを対象とする従来のセンサーグリッドと異なり,画像や音声も対象とする.そのためにプライバシの保護に配慮することが必要となる.また,画像データなどのデータは大量であるが,不必要なデータも多く,プライバシーに配慮する必要になるため,データは蓄積せずにセンサの直近で処理することが望ましい.そのためのアーキテクチャとして,遠隔プログラム実行によりセプライバシ情報や不要なデータを除去可能で,かつ認証機構によるアクセス制御が可能なセンシング Web のアーキテクチャを提案する.Recently sensor devices such as video cameras, infrared sensors and microphones on various places such as the building, in the town, and roads and the station yards are being placed. It is a promising technology to make use of these sensors connected by the network. Sensing web is a project to Bhare sensors open to the public in wide-area network, not only sensors closed in a network. Different from existing sensor grids for simple sensor devices, the Sensing web includes sensor devices such as video cameras and microphone. This requires consideration for privacy on the data from sensors. While sensor data such as images is relatively large, required information in the data may often be small and include privacy. So it is desirable to process the data and extract the information near the sensors. In this paper, we propose the architecture which can protect privacy information and remove useless data by shipping the remote program execution into the node near to a sensor with the access control by the authentication mechanism.

2009-10-07 02:35:47
1 はてなブックマーク

https://ci.nii.ac.jp/naid/110006944046

1 0 0 0 ネットワーク数値ライブラリNinfにおけるメタサーバアーキテクチャ

著者: 中田秀基草野貴之松岡聡佐藤三久関口智嗣
出版者: 一般社団法人情報処理学会
雑誌: 情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日: vol.1996, no.22, pp.77-82, 1996-03-04
被引用文献数: 3

ネットワーク数値情報ライブラリNinf(etwork based Infomation library for High Performance Computin)は、高速なネットワークを前提として、主に数値演算の分野において、計算自体を多くのユーザに提供することを目指したシステムである。本稿では、Ninfシステムを構築する要素の一つであるメタサーバに関して、そのアーキテクチャを示し、簡単な性能予備評価を示す。メタサーバは、サーバとクライアントの間にたちサーバの場所をクライアントに対して隠蔽する役割を果たす。また、メタサーバを用いることにより、簡単な分散並列計算が可能になる。To establish a framework of information sharing in the numerical computation area, we have proposed the Ninf, Network based information library for high performance computing. In this paper, we show a Meta Server architecture, which is a component of the Ninf system. Meta Server stand between the Server and the Client and hides the Server from the Client. It also enables easy distributed concurrent computation.

2009-07-24 10:24:19
1 はてなブックマーク

https://ci.nii.ac.jp/naid/110002932177