著者
高橋 大介 金田 康正
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.39, no.7, pp.2074-2083, 1998-07-15
参考文献数
26
被引用文献数
6

本論文では,分散メモリ型並列計算機により高精度の円周率を高速に計算する方法について述べる.高精度の円周率は,Gauss?Legendreの公式およびBorweinの4次の収束の公式を用いると効率良く計算できることが知られている.これら2つの公式には平方根や4乗根,そして逆数計算が含まれているが,それらの計算はNewton法を適用することで,多倍長数の加減乗算に帰着させることができる.n桁どうしの多倍長乗算は高速Fourier変換(FFT)を用いればO (nlognloglogn)で行えるが,多倍長乗算の主要部分であるFFTの計算および多倍長数の加減乗算における正規化の部分を並列化した.その結果,1024プロセッサから成る分散メモリ型並列計算機HITACHI SR2201で515億桁余りの円周率の計算が検証時間を含めて66時間11分で終了した.This paper discusses the fast multiple-precision calculation of π on distributed memory parallel processors.It is well knowen that the multiple-precision π can be efficiently computed by the Gauss-Legendre algorithm and the Borweins' quartically convergent algorithm.Although two algorithms include the square root,4th root and reciprocal calculation,these calculations can be reduced to the multiple-precision addition,subtracion and multiplication by using Newton method.Multiple-precision multiplication of n digits numbers can be realized with the computational complexity of O(nlognloglogn)by using fast Fourier transform(FFT).Calculation of FFT which is crucial to the multiple-precision multiplication and normalization of the multiple-precision addition,subtraction and multiplication can be parallelized.More than 51.5 billion decimal digits of π were calculated on the distributed memory parallel processor HITACHI SR2201(1024PEs)within computing elapsed time of 66 hours 11 minutes which includes the time for the verification.
著者
梅村 雅之 中本 泰史 朴 泰祐 高橋 大介 須佐 元 森 正夫 佐藤 三久
出版者
筑波大学
雑誌
特別推進研究
巻号頁・発行日
2004

宇宙第一世代天体の誕生は、宇宙全体の進化、銀河の誕生、重元素の起源を解き明かす上で根源的な問題である。本計画の目的は、宇宙第一世代天体形成過程について、超高精度のシミュレーションを行い、その起源を解き明かすことにある。そのために、天体形成シミュレーションの専門家と計算機工学の専門家が、緊密な協力体制の下に重力計算専用ボードBlade-GRAPEを開発し、これをPCクラスタに融合させた宇宙シミュレータFIRSTを開発した。FIRSTは、256の計算ノード、496CPUからなり、2つのファイルサーバをもつ。また、分散したローカルディスクから一つの共有ファイルシステムを構築するGfarmシステムが導入されており、総計22TBのファイルシステムをもつ。FIRSTの総演算性能は、36.1TFLOPSであり、内ホスト部分3.1TFLOPS、Blade-GRAPE部分33TFLOPSである。また、主記憶容量は総計1.6TBである。このような融合型並列計算機の開発は、世界でも例を見ないものである。FIRSTを用いてこれまでにない大規模なシミュレーションを実行した。その結果、次のような成果を得た。(1)宇宙第一世代天体形成のダークマターカスプに対する依存性の発見、(2)初代星に引き続いて起こる星形成への輻射性フィードバックの輻射流体計算とフィードバック条件の導出、(3)紫外線輻射場中の原初星団形成シミュレーションによる球状星団形成の新たな理論モデルの提唱、(4)3次元輻射輸送計算による原始銀河からの電離光子の脱出確率の導出、(5)銀河団合体時の非平衡電離過程効果の発見、(6)アンドロメダ銀河と衛星銀河の衝突による“アンドロメダの涙"のモデル提唱。中でも(1)は、過去の他グループの計算に比べて2桁以上高い質量分解能を実現することによってもたらされたものである。この計算によって、従来の第一世代天体に対する描像に見直しが必要であることが明らかとなった。
著者
平櫛貴章 高橋大介
出版者
一般社団法人情報処理学会
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2013, no.12, pp.1-6, 2013-05-22

近年,様々な分野で巨大なグラフが出現しており,そのようなグラフを高速に処理する方法が必要となりつつある.また,GPU を搭載したクラスタシステムの台頭も著しく,Top500 ランキングにおいても複数の GPU クラスタが上位にランクインしている.しかし,LINPACK ベンチマークで示された性能に対して GPU クラスタのグラフ処理能力はあまり高いものとなっておらず,アルゴリズムの改善によるさらなる高速化が必要であると考えられる.そこで,本稿では GPU クラスタにおいて大規模なグラフの幅優先探索を高速化する手法を提案し,実装および評価を行った.その結果,GPU を利用することで CPU のみを用いた場合に比べてより高速に幅優先探索を行うことができることが分かった.
著者
中西 大祐 永長 知孝 高橋 大介
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. ITS
巻号頁・発行日
vol.108, no.471, pp.59-64, 2009-03-02
被引用文献数
5

本稿では,都市景観内スポット情報とWeb上の住所情報を用いたポジショニングシステムの検討が行われている.まず,既存のポジショニングシステムの精度の確認をするために,携帯電話に搭載されているGPS機能を用いて,都市部において測位実験が行われている.次に,システムの提案が行われている.利用者は携帯電話のWebブラウザを用いて,専用フォームからサーバ側に周辺の建物に関する情報とGPS等から取得した位置情報を送信し,その情報をもとに実行されたWeb検索結果から位置情報を得ることができる.提案方式について評価するため,GPS実験の位置情報と測定地点のスポット名情報を用いたシステムの動作実験が行われ,GPS単独使用時より測位精度の向上が見られることが示されている.最後に,提案システムの考察が行われ,使用するスポットの選択,Webサイトの構造と測位誤差の関係について述べられている.
著者
織茂 裕介 玉國 祐司 高橋 大介 岡本 教佳
出版者
一般社団法人 映像情報メディア学会
雑誌
映像情報メディア学会技術報告 38.9 (ISSN:13426893)
巻号頁・発行日
pp.31-32, 2014-02-15 (Released:2017-09-22)

本研究では奥行情報とカラー画像を取得できるセンサとしてKinectを用いて手話の指文字を認識する手法を検討する.手話および指文字の認識に関する研究はこれまで静止画像やビデオ映像を対象として数多く行われてきたが,オクルージョン判定や奥行きの位置情報を正確に把握することは困難であった.Kinectを用いれば比較的安価で奥行情報を取得できるため,手軽に指文字認識が可能なシステムを提案する.
著者
高橋 大介
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.41, no.6, pp.1918-1921, 2000-06-15

本論文では,Fibonacci数を高速に計算する方法について述べる.Fibonacci数 $F_n$ を計算するには,Lucas数の積に基づくアルゴリズムが,最もビット演算量が少ないことが知られている.このアルゴリズムにおいて,多倍長数の乗算を多倍長数の自乗計算に置き換えることで,さらに演算量を減らすことができることを示す.
著者
高橋 大介
出版者
筑波大学
雑誌
若手研究(B)
巻号頁・発行日
2002

本研究の目的は,PCクラスタにおける高速フーリエ変換(fast Fourier transform,以下FFT)の並列アルゴリズムの実現および評価が挙げられる。近年,PCクラスタの普及に伴い,並列FFTアルゴリズムが様々な研究者によって提案されており,ライブラリとなっているものも多い。ところが、これらの並列FFTアルゴリズムはデータ数がN=2^pのように,2のべき乗で表される場合についてのものが多い。そこで本研究では,PCクラスタにおいてデータ数がN=2^p3^q5^rの場合について多次元の並列FFTアルゴリズムの実現および評価を行った。PCクラスタでは,一つのノードがSMP構成になっている場合があり,この場合にはPCクラスタが共有メモリ型並列計算機と分散メモリ型並列計算機の両方のアーキテクチャの特性を兼ね備えたものになるが,それぞれのアーキテクチャにおいて最適な並列FFTアルゴリズムは異なるために,本研究では異なるアーキテクチャについてそれぞれ並列FFTアルゴリズムを実現し,評価を行った。そして,これらの並列FFTアルゴリズムを実際にPCクラスタ上に実現し,今までの逐次FFTアルゴリズムに対する性能向上率を評価した。さらに,並列FFTアルゴリズムでは,各プロセッサ内におけるFFTの計算量をできるだけ削減する必要があるが,より演算量の少ないFFTアルゴリズムについても研究を行った。また,平成15年度に行った研究成果を,国際会議等で発表すると共に,それらの内容をまとめて学術雑誌等で論文を発表した。
著者
高橋 大介
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.41, no.6, pp.1918-1921, 2000-06-15
参考文献数
9

本論文では,Fibonacci数を高速に計算する方法について述べる.Fibonacci数 $F_n$ を計算するには,Lucas数の積に基づくアルゴリズムが,最もビット演算量が少ないことが知られている.このアルゴリズムにおいて,多倍長数の乗算を多倍長数の自乗計算に置き換えることで,さらに演算量を減らすことができることを示す.We present a fast algorithm for computing Fibonacci numbers.It is known that the product of Lucas numbers algorithm usesthe fewest bit operations to compute the Fibonacci number $F_n$.We show that the number of bit operations in the conventional product ofLucas numbers algorithm can be reduced by replacingmultiple-precision multiplication with the multiple-precision square operation.
著者
高橋 大介
雑誌
情報処理
巻号頁・発行日
vol.50, no.12, pp.1228-1234, 2009-12-15
著者
高橋 大介 南條 悠太 大山 淳一 藤井 直紀 福森 香代子 武岡 英隆
出版者
日本海洋学会
雑誌
海の研究 (ISSN:09168362)
巻号頁・発行日
vol.19, no.1, pp.1-19, 2010-01-05
被引用文献数
2

四国西岸に位置する法花津湾において2005年から2007年の夏季にビデオモニタリングを行い,湾内表層で形成されるミズクラゲ集群出現頻度の時間変動について調べた。ミズクラゲ集群出現頻度には,8月中旬から増加し,9-10月に減少する長周期変動と,10-15日周期で増減を繰り返す短周期変動が存在した。特に,短周期変動の強弱の経年変化は,四国西岸域で生じる急潮の強弱の経年変化と一致していた。そこで,急潮とミズクラゲ集群出現頻度の短周期変動との関係を明らかにするため,2007年の夏季法花津湾において係留観測と海洋観測を行った。法花津湾へ到達した急潮は湾内に暖水流入を引き起こすとともに,湾スケールの海水交換を励起した。この暖水流入にともなって湾外の既存水塊中にいたミズクラゲが湾内へ輸送され,湾内表層で受動的に集群することによって,夏季法花津湾表層ではミズクラゲ集群出現頻度が10-15日周期で変動していると考えられる。
著者
佐藤 佳州 高橋 大介
雑誌
ゲームプログラミングワークショップ2011論文集
巻号頁・発行日
vol.2011, no.6, pp.135-142, 2011-10-28

近年,ゲームプログラミングの分野において機械学習は急速に発展しており,評価関数の重みの決定,探索深さの調整,モンテカルロシミュレーションにおける指し手の予測など,幅広い課題に対して有効であることが示されている.現在のゲームプログラミングにおける機械学習は,あらかじめ評価項目(特徴)を用意し,プロの棋譜などを基にその重みを学習するというものが主流である.このような手法は,人間では調整できないような膨大な数の特徴に対しても,自動的に適切な重みを算出できるという利点がある.一方で,学習に用いる特徴自体は人間が手動で設計する必要があり,性能を決定する大きな要因となっている.現在,特徴の設計に関しては,人手による試行錯誤的な調整が行われているが,機械学習に有効な特徴を手動で生成することは一般的に非常に困難な問題である.本論文では,この問題を解決するため,特徴の自動生成と機械学習の重み付けを組み合わせることにより,有効な特徴を生成する手法を提案する.具体的には,機械学習の反復計算の過程に特徴の生成を組み込むことで,性能の向上を目指す.実験の結果,提案手法が現在ゲームプログラミングの分野で用いられている各学習手法において有効であることを示した.
著者
椋木 大地 高橋 大介
雑誌
ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集
巻号頁・発行日
vol.2011, pp.148-156, 2011-01-11

本研究では 4 倍・8 倍精度演算に対応した BLAS (Basic Linear Algebra Subprograms) 関数を GPU (Graphics Processing Unit) 向けに実装し評価を行った.4 倍・8 倍精度演算には double 型倍精度数を 2 つ連結して 4 倍精度数を表す double-double (DD) 型 4 倍精度演算,および 4 つ連結して 8 倍精度数を表現する quad-double (QD) 型 8 倍精度演算を用いた.NVIDIA Tesla C2050 による性能評価では,Intel Core i7 920での同一処理と比べ,4 倍精度 AXPY が約 9.5 倍,8 倍精度 AXPY が約 19 倍高速化された.また 4 倍精度 GEMM は CPU に比べて約 29 倍,8 倍精度 GEMM は約 24 倍の高速化を達成した.さらに Tesla C2050 では 4 倍精度 AXPY が倍精度演算の高々 2.1 倍の演算時間となり,GEMV,GEMM でも倍精度演算に対する計算時間の増大が CPU の場合と比べ大幅に削減された.一方で PCI-Express (PCIe) によるデータ転送時間を考慮した場合,倍精度 GEMM は PCIe データ転送性能に律速される傾向が見られたが,4 倍・8 倍精度 GEMM ではこれがほぼ解消されることが示された.本論文では 4 倍・8 倍精度 BLAS 演算が GPU に適しており,CPU に比べ実用的な性能が得られることを示す.
著者
高橋 大介
巻号頁・発行日
2012

科学研究費助成事業(科学研究費補助金)研究成果報告書:若手研究(B)2010-2011
著者
久保田 悠司 高橋 大介
出版者
情報処理学会
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:18840930)
巻号頁・発行日
vol.2010, no.19, pp.1-7, 2010-12-09

近年,科学技術計算の分野で GPGPU が注目されている.科学技術計算では,特に疎行列ベクトル積を用いることが多いため,疎行列ベクトル積の高速化が重要である.疎行列には多くの格納形式があるが,疎行列によって最適な格納形式は異なる.そこで,本研究では与えられた疎行列によって最適な格納形式に変換してから,疎行列ベクトル積を行うことで高速化を図る.まず予備実験として,いくつかの疎行列の格納形式について,疎行列ベクトル積を実装し,実行速度を測定した.その後,予備実験の結果をもとに自動選択するためのパラメータを決定し,自動選択アルゴリズムを実装する.また,実装したアルゴリズムを,反復法による連立一次方程式の求解を用いて評価した.その結果,多くの疎行列において最適な格納形式を選択し高速化することに成功した.Sparse matrix vector multiplication is one of the most often used functions in scientific and engineering computing.The storage schemes for sparse matrices have been proposed,however,each sparse matrices have an optimal storage scheme,In this paper,we propose an auto-tuning algorithm of sparse matrix vector multiplication by selecting storage schemes automatically on GPU,We evaluated our algorithm using Conjugate Gradient solver.As a result,we found that our algorithm was effective in many sparse matrices.
著者
佐藤 三久 朴 泰祐 建部 修見 天笠 俊之 櫻井 鉄也 山本 有作 高橋 大介 北川 博之
出版者
筑波大学
雑誌
基盤研究(A)
巻号頁・発行日
2005

P2Pグリッドとは、従来、各研究組織にある計算資源を共有することが目的であったグリッド技術を、P2P技術を活用しオフィスおよび個人のPCなどの潜在的な計算資源をグリッドの計算資源として活用するものである。本研究の目的は、期待される大量の計算資源による大容量コンピューティングのためのP2Pグリッド基盤を構築・利用する技術を確立し、その有効性を検証することである。1. P2P環境の潜在的な計算資源をグリッドの計算資源として活用するために、多くのPCで利用されているWindowsにおいてLinuxバイナリを実行するためのシステムBEEとUDPによるファイアウォール越えを用いたP2Pオーバーレイネットワークを開発した。さらに、P2P環境における認証機構として、匿名相互証明書とP2P通信を用いる認証方式AUBReX、他のジョブスケジューラと相互に協調し資源を共有する機構について開発した。2. 大容量コンピューティングのプログラミングモデルとして、RPCモデルから広域ネットワーク上の大容量データを効率的に扱うためのデータレイヤOmniStorageを開発し、それを拡張し、多数のノードに分散配置された大量データに対して、グローバルなデータ並列操作を行うプログラミング環境を提案した。また、大規模スケーラブルP2PにおけるXMLデータ管理について、MLデータの内容による検索に着目し,P2Pネットワーク上でXMLデータのキーワード検索を可能にする手法を考案した。3. P2Pグリッド向きのアルゴリズムとして、複素積分を用いた非線形固有値計算アルゴリズムや前処理手法を開発した。また、P2Pグリッドの有望な高性能な計算資源として、ヘテロジーニアスマルチコアであるCellプロセッサを取り上げ、この資源を利用するための数値計算ソフトウエアを実装した。
著者
石川 裕 高橋 大介 朴 泰祐 佐藤 三久
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. HPC,[ハイパフォーマンスコンピューティング] (ISSN:09196072)
巻号頁・発行日
vol.92, pp.1-6, 2002-10-25
被引用文献数
1

4台の4 way Itanium(800MHz)プロセッサから構成されるクラスタ上にSCoreクラスタシステムソフトウエアを移植し、ItaniumによるSCoreクラスタの性能を測定する。Pentium-III(933MHz)プロセッサによるクラスタと比較した結果、姫野ベンチマークでは、単体性能でItaniumプロセッサはPentium IIIプロセッサの3倍の性能がある。NAS並列ベンチマークのCGの結果では、16プロセッサ構成までの比較で、ItaniumプロセッサはPentium IIIプロセッサの2.7倍〜1.3倍高速である。