著者
椋木 大地 今村 俊幸
出版者
一般社団法人情報処理学会
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2014, no.26, pp.1-6, 2014-12-02

NVIDIA が 2014 年にリリースした Maxwell アーキテクチャの GM107・GM204 コア搭載 GPU は,浮動小数点演算の理論ピーク演算性能比が倍精度:単精度 =1:32 である.このような環境ではソフトウェアで実装した疑似倍精度演算を用いた方が,倍精度の計算を高速に行える可能性がある.本稿では GM204 コアを搭載する GeForce GTX 980 を対象に,単精度型を 2 個連結して倍精度型を表現し,単精度演算で疑似的な倍精度演算を実現する double-float 演算 (DF 演算) を用いて,倍精度行列積を計算する BLAS ルーチンである DGEMM を実装した.その結果,ハードウェアの倍精度演算による通常の DGEMM と比べて,DF 演算を用いた DGEMM は約 2 倍の性能が得られた.
著者
椋木 大地 今村 俊幸
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2014-HPC-147, no.26, pp.1-6, 2014-12-02

NVIDIA が 2014 年にリリースした Maxwell アーキテクチャの GM107・GM204 コア搭載 GPU は,浮動小数点演算の理論ピーク演算性能比が倍精度:単精度 =1:32 である.このような環境ではソフトウェアで実装した疑似倍精度演算を用いた方が,倍精度の計算を高速に行える可能性がある.本稿では GM204 コアを搭載する GeForce GTX 980 を対象に,単精度型を 2 個連結して倍精度型を表現し,単精度演算で疑似的な倍精度演算を実現する double-float 演算 (DF 演算) を用いて,倍精度行列積を計算する BLAS ルーチンである DGEMM を実装した.その結果,ハードウェアの倍精度演算による通常の DGEMM と比べて,DF 演算を用いた DGEMM は約 2 倍の性能が得られた.
著者
今村 俊幸 村松 一弘 北端 秀行 金子 勇 山岸 信寛 長谷川 幸弘 武宮 博 平山 俊雄
雑誌
情報処理学会研究報告計算機アーキテクチャ(ARC)
巻号頁・発行日
vol.2001, no.22(2000-ARC-142), pp.49-54, 2001-03-08

世界各国の計算機資源のみならず様々なネットワーク上の装置を有機的に結合し,一つの仮想計算機システムを構築する試みとしてメタコンピューティングが提案されている.日本原子力研究所では,これまで所内LANでの仮想計算機上を構築し数値アプリケーションの実験を行ってきたが,さる2000年11月アメリカ,ダラスにて開催された国際会議SC2000期間中に日独米英4ヶ国のスパコンを結合して世界規模での実験の試みに成功した.本実験では,放射線情報推定システムを題材として世界5機関の並列計算機を利用し最大計510CPUの仮想計算機の構築並びに,仮想計算機上での計算を行った.また,計算と同時に仮想計算機から大気中に放出された放射性物質の拡散過程を可視化することも実施した.本報告では,世界規模での実アプリケーションの実験の概要とその結果についてまとめる.
著者
今村 俊幸 村松 一弘 北端 秀行 金子 勇 山岸 信寛 長谷川 幸弘 武宮 博 平山 俊雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告計算機アーキテクチャ(ARC) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.22, pp.49-54, 2001-03-08

世界各国の計算機資源のみならず様々なネットワーク上の装置を有機的に結合し,一つの仮想計算機システムを構築する試みとしてメタコンピューティングが提案されている.日本原子力研究所では,これまで所内LANでの仮想計算機上を構築し数値アプリケーションの実験を行ってきたが,さる2000年11月アメリカ,ダラスにて開催された国際会議SC2000期間中に日独米英4ヶ国のスパコンを結合して世界規模での実験の試みに成功した.本実験では,放射線情報推定システムを題材として世界5機関の並列計算機を利用し最大計510CPUの仮想計算機の構築並びに,仮想計算機上での計算を行った.また,計算と同時に仮想計算機から大気中に放出された放射性物質の拡散過程を可視化することも実施した.本報告では,世界規模での実アプリケーションの実験の概要とその結果についてまとめる.Metacomputing, which enables us to construct a virtual computer system with some computer resources or experimental devices via internet connection, was proposed. Japan Atomic Energy Research Institute, JAERI, also continued to carry out several numerical simulations on a virtual computer system even though it was restricted in the JAERI's LAN. At SC2000, we had an opportunity to construct a worldwide virtual supercomputer with help of several supercomputer centers at Germany, US, UK and Japan, and we succeeded to execute a "Quick responsible source estimation system" with 510 processor units on 5 sites. Furthermore we demonstrated a real-time visualization for the dispersion process of radioactive particles released into atmosphere. In this report, we summarized the result of worldwide metacomputing experiment.
著者
田村遼也 今村俊幸 仲谷栄伸
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2014-HPC-143, no.21, pp.1-7, 2014-02-24

近年提唱されている,特に縦長行列 (m×n かつ m≫n) の QR 分解アルゴリズム Tall Skinny QR(TSQR) は階層的な構造による高並列性と通信最適性により極めて注目が集まっている解法である.本研究では GPGPU による TSQR の実装の中でも,CPU 資源を極力使わず,主たる計算部分を GPU に担当させる完全オフロード実装に関する研究を進めた.現時点では TSQR のフルバリエーションは未完成ではあるが,上三角行列Rの集約計算を限定したものの完全オフロード化に成功している.既存の GPU 数値計算ライブラリの代表格である MAGMA と比較しても,高速化するケースがあり,TSQR の並列性と GPU の高い処理能力が立証されたといえる.
著者
今村 俊幸 工藤 周平 鈴木 厚 廣田 悠輔 鈴木 智博 椋木 大地
出版者
国立研究開発法人理化学研究所
雑誌
基盤研究(B)
巻号頁・発行日
2019-04-01

エクサ時代のメニイコア環境下において、システム実行効率を向上するための数値計算アルゴリズムならびにタスク技術周辺を数値線形計算の視点から研究する。将来にわたって持続可能な高性能な数値計算ソフトウェアのための開発フレームワーク実現に注力し、数値線形代数カーネル構築の経験から発想される新たなタスクスケジューリング技術(非同期・条件付き・競争的スケジューリング)を研究する。同技術要件をスケジューラプロトタイプとして試作し、既存数値線形代数ソフトウェアに取り込み高性能化・高並列化を実現する。更にエクサ時代のターゲットなる高次元データ解析向け数値計算ソフトウェアに対しても適用範囲を広げていく。
著者
今村 俊幸 大井 祥栄 深谷 猛 廣田 悠輔 椋木 大地 山本 有作 藤堂 眞治
出版者
国立研究開発法人理化学研究所
雑誌
基盤研究(B)
巻号頁・発行日
2015-04-01

本研究は、数万から数億のコアプロセッサが搭載される計算システム環境下において、過去に蓄積された高性能な数値計算サービスを新しい数学原理に基づき実現することを目的にし、「異粒度数値カーネル構築」と共に「非同期的な数値計算アルゴリズム」の2大テーマのもと、1)非同期的数値計算アルゴリズムに関する理論と実用レベルにある省通信・省同期アルゴリズムについて研究しCAHTRやFDTD向けの手法を提案した。更に、2)超メニイコアでのスケーラブルな軽量コード生成のための自動チューニングなどの核基盤技術研究を推進し次世代数値計算ソフトウェアの新技術創出に繋がる新機軸探究を進めた。
著者
山田 進 今村 俊幸 町田 昌彦
出版者
一般社団法人 日本計算工学会
雑誌
日本計算工学会論文集 (ISSN:13478826)
巻号頁・発行日
vol.2006, pp.20060027-20060027, 2006 (Released:2006-09-28)
参考文献数
16

In order to improve the convergence property of the preconditioned conjugate gradient (PCG) method for solving eigenvalue problems of the Hamiltonian matrix, we propose a new preconditioning method. The preconditioner utilizes not only an approximate eigenvalue which is obtained during the CG iterations but also its residual error. We demonstrate that the PCG method with the new preconditioner can solve the eigenvalue problem for the Hamiltonian matrix several times faster than the PCG method with the conventional preconditioner.
著者
山田 進 町田 昌彦 大橋 洋士 松本 秀樹 今村 俊幸
出版者
独立行政法人日本原子力研究開発機構
雑誌
基盤研究(C)
巻号頁・発行日
2011

本研究ではメニーコア計算機用を対象に、量子多体モデルのシミュレーション手法である密度行列繰り込み群法と厳密対角化法の並列化・高速化を実施した。特に、モデルの物理的性質と計算機のネットワークアーキテクチャを考慮して、高速な通信手法を提案しその有効性を確認した。また、開発したコードを実際の物理問題に適用し、それらの物理的性質についての議論を行った。
著者
姫野 龍太郎 藤野 清次 阿部 邦美 小野 謙二 伊藤 祥司 岡本 吉史 今村 俊幸 片桐 孝洋 伊藤 利佳 中田 真秀
出版者
独立行政法人理化学研究所
雑誌
基盤研究(B)
巻号頁・発行日
2009

電磁界問題,量子化学計算,数値流体計算の大規模数値シミュレーションに向けて,大規模行列計算に向けた高速化,高精度化,安定化を実現し,従来手法では解きにくい問題に対する新たな求解アルゴリズムを提案した.さらに,そのようなシミュレーションを支援するために,応用問題の特性に応じたデータ構造を決定する自動チューニング技術,ジョブスケジューラによる最適な計算機資源割当て方式,任意高精度線形代数演算パッケージも開発した.
著者
今村 俊幸 村松 一弘 北端 秀行 金子 勇 山岸 信寛 長谷川 幸弘 武宮 博 平山 俊雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.22, pp.49-54, 2001-03-08

世界各国の計算機資源のみならず様々なネットワーク上の装置を有機的に結合し,一つの仮想計算機システムを構築する試みとしてメタコンピューティングが提案されている.日本原子力研究所では,これまで所内LANでの仮想計算機上を構築し数値アプリケーションの実験を行ってきたが,さる2000年11月アメリカ,ダラスにて開催された国際会議SC2000期間中に日独米英4ヶ国のスパコンを結合して世界規模での実験の試みに成功した.本実験では,放射線情報推定システムを題材として世界5機関の並列計算機を利用し最大計510CPUの仮想計算機の構築並びに,仮想計算機上での計算を行った.また,計算と同時に仮想計算機から大気中に放出された放射性物質の拡散過程を可視化することも実施した.本報告では,世界規模での実アプリケーションの実験の概要とその結果についてまとめる.Metacomputing, which enables us to construct a virtual computer system with some computer resources or experimental devices via internet connection, was proposed. Japan Atomic Energy Research Institute, JAERI, also continued to carry out several numerical simulations on a virtual computer system even though it was restricted in the JAERI's LAN. At SC2000, we had an opportunity to construct a worldwide virtual supercomputer with help of several supercomputer centers at Germany, US, UK and Japan, and we succeeded to execute a "Quick responsible source estimation system" with 510 processor units on 5 sites. Furthermore we demonstrated a real-time visualization for the dispersion process of radioactive particles released into atmosphere. In this report, we summarized the result of worldwide metacomputing experiment.