文献一覧: 中島研吾 (著者)

1 0 0 0 OA 「京」の後の時代を支えるスパコン:4.メニーコアアーキテクチャに基づくスーパーコンピュータ

著者: 朴泰祐中島研吾
雑誌: 情報処理
巻号頁・発行日: vol.60, no.12, pp.1193-1197, 2019-11-15

本記事では,スーパーコンピュータの中心となるプロセッサアーキテクチャとして,メニーコア型のものを取り上げ,その代表的システムであるOakforest-PACSを例に解説する.同アーキテクチャに基づくプロセッサとして最もよく用いられているのはIntel社性のXeon Phiプロセッサファミリーであるが,一般的なマルチコアプロセッサと異なり,細かい性能チューニングが必要である.Oakforest-PACSのシステム構成と代表的アプリケーション,およびJCAHPCにおける運用について解説する.

2023-04-14 17:22:05
1 + 1 Twitter

http://id.nii.ac.jp/1001/00200367/

1 0 0 0 OpenMPを用いたGPUオフローディングの有効性の評価

著者: 河合直聡三木洋平星野哲也塙敏博中島研吾
雑誌: 研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:21888841)
巻号頁・発行日: vol.2022-HPC-183, no.18, pp.1-9, 2022-03-10

限られた電力,設置面積で最大の性能を得られるスーパーコンピュータシステムを実現するためには,GPU 等の演算加速装置の導入が不可避となりつつある.汎用 CPU 向けに Fortran や C/C++ で記述され,OpenMP で並列化されたプログラムを CUDA 等を使って GPU 向けに書き直すことはコストがかかる.OpenMP にはバージョン 4.0 以降は GPU 等でプログラムを実行するオフローディング機能がサポートされている.本研究では,この機能を用いて,演算律速なアプリケーションである N 体計算およびメモリ律速なアプリケーションである ICCG 反復法に適用し,NVIDIA A100,AMD MI100 上での性能評価を実施した.結果,N 体計算では A100 上では CUDA 実装の 58.3%,MI100 上では HIP 実装の 71.9% の演算性能を確認した.また,ICCG 法では Stream Triad ベンチマークで計測したメモリースループットの 88%(A100)と 53%(MI100)を確認した.以上の結果から,OpenMP での GPU オフローディングは,MI100 上での ICCG 法を除いて,実用的な範囲と考える.

2022-03-18 12:16:54
1 + 0 Twitter

http://id.nii.ac.jp/1001/00217388/

1 0 0 0 OA データ解析・シミュレーション融合スーパーコンピュータシステムReedbush-Uの性能評価

著者: 塙敏博中島研吾大島聡史伊田明弘星野哲也田浦健次朗
雑誌: 研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:21888841)
巻号頁・発行日: vol.2016-HPC-156, no.10, pp.1-10, 2016-09-08

東京大学情報基盤センターでは,データ解析・シミュレーション融合スーパーコンピュータシステム Reedbush を導入し,2017 年 3 月より全系稼働開始予定である.Reedbush システムは,Intel Xeon E5 (Broadwell-EP) プロセッサに加えて NVIDIA Tesla P100 (Pascal) GPU を一部計算ノードに搭載する他,高速ファイルキャッシュシステムや,InfiniBand EDR などを始めとして導入時点で最新の技術を集めたシステムである.本稿では 2016 年 7 月から稼働を開始した汎用 CPU のみからなる Reedbush-U サブシステムの性能について報告する.

2020-10-08 23:45:00
1 はてなブックマーク

http://id.nii.ac.jp/1001/00174434/

1 0 0 0 低精度演算とアプリケーション性能

著者: 中島研吾坂本龍一星野哲也有間英志塙敏博近藤正章
雑誌: 研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:21888841)
巻号頁・発行日: vol.2020-HPC-174, no.5, pp.1-9, 2020-05-06

近年,科学技術計算において,低精度演算を積極的に活用することにより,計算時間を短縮する試みが活発に行われている.また,低精度演算による計算の精度を保証するための実用的手法についても研究が進められている.本研究では,アプリケーションの実装方法,問題規模と低精度演算による性能改善の関係に注目し,様々なハードウェア環境下での検討を実施した.

2020-05-07 02:09:02
1 + 0 Twitter

http://id.nii.ac.jp/1001/00204393/

1 0 0 0 IR トピックス

著者: 中島研吾牧島一夫本原顕太郎駒宮幸男神山忍青木秀夫広報誌編集委員会平賀勇吉藤原晴彦相原博昭岡良隆
出版者: 東京大学大学院理学系研究科・理学部
雑誌: 東京大学理学系研究科・理学部ニュース
巻号頁・発行日: vol.37, no.5, pp.3-9, 2006-01

「多圏地球システムの進化と変動の予測可能性」国際シンポジウム/物理・天文の21 世紀COE 若手交流シンポジウム報告/第8回公開講演会報告/「楽しむ科学コンクール」の創設/理学部1号館で消防訓練/小形正男先生の日本IBM科学賞受賞をお祝いして/理学部チームがソフトボールでベスト4/ホームカミングデイ/石川統先生ご逝去 : あまりにも早い別れ/藤井忠男先生のご逝去を悼む/最後まで全力投球のまま急逝された川島誠一郎先生

2019-02-16 03:15:15
1 + 0 Twitter

https://ci.nii.ac.jp/naid/120001507269

1 0 0 0 ICCG法ソルバーのIntel Xeon Phi向け最適化

著者: 中島研吾大島聡史塙敏博星野哲也伊田明弘
雑誌: 研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:21888841)
巻号頁・発行日: vol.2016-HPC-157, no.16, pp.1-8, 2016-12-14

SELL-C-σ 法は疎行列演算の性能を高める行列格納手法として注目されているが,これまでは専ら疎行列ベクトル積に適用されてきた.科学技術計算において広く使用されている ICCG 法は前進後退代入,不完全コレスキー分解等のデータ依存性を有するプロセスを含むため,多色順序付け等によって並列性を抽出する必要がある.本研究は世界でも初めて,ICCG 法に SELL-C-σ 法を適用した事例である.Intel Xeon Phi (Knights Corner,Knights Landing) 上での性能評価を実施し,特に Knights Landing 上では従来手法と比較して高い性能改善を達成することができた.

2016-12-27 15:54:20
1 + 0 Twitter

http://id.nii.ac.jp/1001/00176349/

1 0 0 0 OA 自動チューニング機構を有するアプリケーション開発・実行環境ppOpen-HPC

著者: 中島研吾佐藤正樹古村孝志奥田洋司岩下武史阪口秀
雑誌: 研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日: vol.2011-HPC-130, no.44, pp.1-9, 2011-07-20

ヘテロジニアスなアーキテクチャによる計算ノードを有するポストペタスケールシステムの処理能力を充分に引き出す科学技術アプリケーションの効率的な開発,安定な実行に資する「自動チューニング機構を有するアプリケーション開発・実行環境:ppOpen-HPC」を開発する.対象離散化手法を有限要素法,差分法,有限体積法,境界要素法,個別要素法に限定し,各手法の特性に基づきハードウェアに依存しない共通インタフェースを有するアプリケーション開発用ライブラリ群,耐故障機能を含む実行環境を提供する.自動チューニング技術の導入により,様々な環境下における最適化ライブラリ,耐故障機能を持つ最適化アプリケーションの自動生成を目指す.本研究は 2014 年度に東京大学情報基盤センターに導入予定の数十ペタフロップス級システムをターゲットとし,同システム上で実アプリケーションによって検証,改良し,一般に公開する.

2015-01-13 22:02:54
1 + 0 Twitter

http://id.nii.ac.jp/1001/00075585/