著者
鶴岡 慶雅 田浦 健次朗
雑誌
情報処理
巻号頁・発行日
vol.56, no.5, pp.452-455, 2015-04-15

本稿では,コンピュータに関する諸分野を専攻する,いわゆる「情報系」の学科において,どのような数学が教えられているかを概観する.情報系の数学カリキュラムを構成する,解析学(微分・積分),線形代数,確率統計,微分積分,ベクトル解析,フーリエ解析,離散数学,代数学,情報理論,アルゴリズム,形式言語理論,計算量理論,数理論理学,言語モデル論,数値解析,最適化,グラフ理論などについて,情報処理とのかかわりにふれつつ簡単に紹介する.
著者
堀内 美希 田浦 健次朗
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2011, no.38, pp.1-7, 2011-07-20

本研究の目的は,データ集約的な並列計算を行う際に重要な役割を担う,分散ファイルシステムの性能を,高遅延広帯域環境において向上させることである.現在の分散ファイルシステムは,高遅延環境で動作させると遅延の影響を受け,データ転送の際に広帯域を活かしきれていない場合がある.これを改善するため,本研究では積極的なデータプリフェッチ等により帯域を有効利用する分散ファイルシステム,Mogami の提案・実装・評価を行い,高遅延環境において,広帯域が達成できていることを確認した.これにより,複数拠点にまたがる高遅延環境を含む分散環境でデータ解析を行う場合の性能向上が期待される.This paper describes a distributed file system that utilizes wide bandwidth in high latency environments. Distributed file systems have been used as a way to share data for data intensive calculation. Existing distributed file systems, however, may fail to exploit the wide bandwidth due to high latency in the wide-area networks. To address this problem, we proposed and evaluated Mogami, a distributed file system that utilizes wide bandwidth even in high latency environment by aggressive data prefetching. In the evaluation we showed Mogami could achieve enough wide bandwidth to accelerate the data analyses in high-latency distributed environment.
著者
堀内 美希 田浦 健次朗
出版者
情報処理学会
雑誌
情報処理学会論文誌コンピューティングシステム(ACS) (ISSN:18827829)
巻号頁・発行日
vol.5, no.5, pp.128-137, 2012-10-15

分散環境でデータ集約的計算を行う際に重要な役割を果たす分散ファイルシステムであるが,高遅延環境でのファイルアクセスでは遅延の影響を受け,大幅にスループットが下がってしまうことがある.それを回避するために,アプリケーションに変更を加えず適応的に実行可能なアクセスデータの先読み手法を提案する.提案手法により,評価に用いた高遅延広帯域環境下でのファイルアクセスでは,シーケンシャルアクセスで約 700~800%, ストライドアクセスで約 300~400% の読み込みスループット向上を確認することができた.Distributed file systems play an important role for data intensive computation but current systems often fail to achieve good throughputs in high latency environments. To achieve a good access throughput, we propose a data prefetching method that can be adatively applicable without any modification to applications. In the evaluation environment with high latency and wide bandwidth, the proposed method achieved the "read" performance improvement of around 700 ~ 800% in sequential access and of around 300 ~ 400% in stride access.
著者
板持貴之 三輪誠 田浦健次朗 近山隆
雑誌
第74回全国大会講演論文集
巻号頁・発行日
vol.2012, no.1, pp.209-210, 2012-03-06

近年,イラスト投稿サイトと呼ばれるサービスを通じ,様々なイラストがインターネット上で閲覧できる.そのようなサービスにおいては,投稿者の情報(作者情報) と共にイラストが投稿されることが多いが,作者の検索を行うときは作者名などのキーワードを知らなければ検索ができないのが現状である.そこで本研究では,作者情報が未知のイラスト画像を入力し,そのイラストの作者らしい作者のランキングを出力する画像認識システムを提案する.画像認識システムの認識手法としては,イラストの作者情報をラベルとした教師あり学習を用いる.本論文では特に,その学習に用いる,作者を識別するためのイラストの特徴量に焦点を当てて提案・評価を行う.
著者
中澤 隆久 田浦 健次朗
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2012-HPC-135, no.12, pp.1-7, 2012-07-25

昨今、並列性能の重要性が高まっているが、代表的なソートアルゴリズムであるクイックソートは逐次実行部分のクリティカルパスの長さのため、並列性能が高いとは言い難い。本研究では並列性能の高いソートの一つである bitonic sort を基盤として、その利点である並列性能の高さを維持しながら、実用においての欠点であるほぼソートされた列に対しての無駄な処理の削減を達成した鋸ソートを提案する。実験の結果、鋸ソートはランダム列に対しては bitonic sort と同等のスケーラビリティを持ち、ほぼソートされた列に対してはごく短い時間でのソートを実現した。
著者
斎藤 秀雄 田浦 健次朗 近山 隆
雑誌
情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2006, no.87(2006-HPC-107), pp.25-30, 2006-07-31

我々が開発している広域分散計算環境用のメッセージパッシングシステムMPI/GXPについて説明する.MPI/GXPは計算環境が実行毎に変化するということを意識して,実行時に測定した遅延や通信量を基に様々な性能最適化を行う.5クラスタ256プロセッサという環境では,遅延を考慮した接続確立を行うことによって,既存のグリッド用メッセージパッシングシステムのようにルータが維持できるセッション数に制限されることなく動作した.また 通信オーバヘッドを考慮したrank 割り当てを行うことによって ランダムなrank割り当てを行った場合と比べてNAS Parallel Benchmarks の性能が60%から100%向上した.

2 0 0 0 OA P2P人狼BBS

著者
吉本 晴洋 繁富利恵 副田 俊介 金子 知適 田浦 健次朗
雑誌
ゲームプログラミングワークショップ2006論文集
巻号頁・発行日
vol.2006, pp.191-194, 2006-11-10

本稿では人狼BBS というゲームをP2P 上で安全に行なうためのプロトコルを提案する。P2P での実装はサーバの管理が不要というメリットがあるが、信頼できる第三者がいないため、プレイヤーが不正を行うことができてしまう。本研究では匿名通信路やゼロ知識証明などの暗号技術を用いて不正を防止するプロトコルを提案した。
著者
小林 直樹 五十嵐 淳 田浦 健次朗 渡部 卓雄
出版者
東京工業大学
雑誌
基盤研究(B)
巻号頁・発行日
1999

本研究の目的は,本研究代表者が提唱した疑似線形型システムに基づく新しいメモリ管理方式の実現により,プログラミング言語処理系のメモリ管理の信頼性および効率を改善することであった.主要な成果は以下のとおり.・擬似線形型システムに基づく型推論によるメモリの獲得・解放命令の挿入…擬似線形型システムに基づき,プログラム中で用いられる各データが最後に使用される箇所を特定し,その部分にメモリの解放命令を挿入するための方法を確立し,関数型言語MLを対象としてプロトタイプシステムを構築した.・擬似線形型システムに基づくメモリ管理のためのバイトコード言語の設計と実装…上で述べたメモリの獲得・解放命令を挿入したプログラムを実際に実行するためのバイトコード言語を設計し,実装を行った.・通常のメモリ管理の改良と本メモリ管理方式との融合…擬似線形型システムのみでは自動的に管理できないメモリが存在するため,既存のメモリ管理方式であるGCを改良して融合する方法について研究した.主な課題はGC自体の性能,特に並列計算機上のGCの性能をあげること,および疑似線形型に基づくメモリ管理によるダングリングポインタの問題の解決であった.後者については型情報を実行時まで保存し,GC時にこれを用いることによってこの問題を解決した.・線形型解析の資源使用解析への一般化…疑似線形型を拡張し,ファイルやネットワークなど一般の計算資源の使用方法の解析を行うための型システムを構築した.これにより(i)割り当てられたメモリはいずれ解放され,解放後はアクセスされない,(ii)オープンされたファイルはいずれクローズされ,クローズ後は読み書きされない,といった性質が満たされているかを統一的に検証することができる.
著者
遠藤 敏夫 田浦 健次朗
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.81, pp.121-126, 2005-08-05

密に通信を必要とする並列計算をグリッド環境において行なう上での障害は、広域ネットワークの高い通信遅延である。本稿は、そのような計算の一つとして密行列のガウス消去法を取り上げ、高遅延環境でも高性能な並列アルゴリズムを述べる。その主要な技術はbatched pivotingと呼ばれるピボット選択手法である。本手法は、複数ステップのピボット選択処理をまとめて行なうことにより、同期コストを大幅に削減する。遅延をエミュレートした実験により、高遅延環境において本手法がpartial pivotingよりもはるかに高速に動作することを示す。一方、本手法ではpartial pivotingよりも計算精度が低下する可能性があるが、比較的良好なピボットを選択することにより、その低下を抑えるよう設計されている。乱数行列を用いた数値実験を通して、本手法がpartial pivotingに匹敵する計算精度を達成することを示す。Large latencies over WAN will remain to be an obstacle to running tightly coupled parallel applications on Grid environments. This paper takes one of such applications, Gaussian elimination of dence matrices and describes a parallel algorithm that is highly tolerant to latencies. The key technique is a pivoting strategy called batched pivoting, which largely reduces synchronization costs by batching pivot selections of several steps. Through experiments with large latencies emulated by software, we show our method works much faster than partial pivoting with large latencies. On the other hand, numerical accuracy of our method may be inferior to that of partial pivoting. However, our method is designed to suppress the degradation by selecting `better' pivots. Through experiments with random matrices, the batched pivoting achieves comparable accuracy to that of partial pivoting.
著者
鴨志田 良和 金田 憲二 遠藤 敏夫 田浦 健次朗 近山 隆
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. CPSY, コンピュータシステム (ISSN:09135685)
巻号頁・発行日
vol.106, no.199, pp.19-24, 2006-07-26
被引用文献数
2

我々は,多数の計算機の効率的な監視と,対話的なコマンド投入を行うシステムVGXP(Visual Grid eXPlorer)を開発している.VGXPは面倒な個々の計算機へのインストールが不要で高速な並列コマンド投入が可能なGXPを拡張したシステムで,計算機のリソース利用率の監視と可視化機能を追加したものである.VGXPを使うと各計算機でのリソース利用率が図示されるので,クラスタの混み具合や負荷分散のバランスを一目で把握することができ,並列プログラムの開発やテストに役立てることができる.また,監視のために各計算機で必要なCPU負荷は約2%程度で,6拠点にまたがる約600台の計算機を監視した場合でも表示ノードにかかるCPU負荷は20%程度と,低負荷で監視を行うことができる.本稿では,これらの機能の実現方法や,監視のための情報収集の性能について説明する.
著者
塙 敏博 中村 遼 空閑 洋平 杉木 章義 田浦 健次朗
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:21888841)
巻号頁・発行日
vol.2022-HPC-183, no.7, pp.1-9, 2022-03-10

mdx は,Society5.0 で目指しているデータの利活用に向けた高性能,柔軟かつセキュアなプラットフォームであり,全国 9 国立大学 2 国立研究所の共同運営による稼働を始めている.本稿では,マルチテナントに対応した仮想化プラットフォームである mdx の概要について紹介し,主に各種ストレージの基本性能について述べる.さらに,mdx におけるソフトウェア基盤整備として,仮想マシンテンプレートと構成管理ツール,Kubernetes によるコンテナ環境について述べる.
著者
田浦 健次朗
出版者
日本ソフトウェア科学会
雑誌
コンピュータ ソフトウェア (ISSN:02896540)
巻号頁・発行日
vol.27, no.4, pp.4_144-4_171, 2010-10-26 (Released:2010-12-26)

GXPは,分散環境におけるシステム管理から並列処理までを,極力小さな導入コストで,多様な環境で行えるようにすることを目指した並列シェルである.2003年末からプロトタイプの開発が開始され,2度のスクラップを経て現在第3版が公開されている.いわゆる並列シェルの機能—同じコマンドラインを多数ホスト上で実行する—を基本としているが,既存の並列シェルと比べ,速度(応答時間), スケーラビリティに優れている.また,「分散環境での並列処理を支援する」という目標に沿って,従来の並列シェルにはない設計指針や機能が多数盛り込まれている.例えば(1) ファイアウォールやNATの存在する分散環境で柔軟に動作する,(2) SSH, Sun Grid Engine, TORQUEなど多様なアクセス方法のホストが混在した環境で動作する,(3) 1ホストにインストールすれば残りのホストにインストールする必要がない,(4) 多数のホスト上で環境変数やカレントディレクトリを設定したり,柔軟に実行ホストを選択したりしながら対話的に処理を進めて行くことができる,などである.さらに,makeを用いたワークフロー(依存関係のある仕事の集合)の記述とその分散並列処理系を組み込んでおり,makefileを記述するだけで,粗粒度タスクの集合を並列実行することができる.これらにより,システム管理の支援を主な対象とした従来の並列シェルと比べ,適用可能範囲が大きく拡大しており,総じて,分散環境を用いて様々なレベルの仕事を行うための,心地よい「環境」として用いることができるソフトウェアになっている.
著者
田浦 健次朗 米澤 明憲
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.41, no.5, pp.1490-1499, 2000-05-15

専有された,分散記憶並列計算機において,局所ごみ集めのスケジュール戦略が性能に与える影響について考察し,実験結果を報告する.分散記憶並列計算機におけるごみ集め(GC)方式は一般に,局所GCと大域GCを組み合わせて用いる.各プロセッサはメモリのある一部の領域を,他のプロセッサの協調なしに回収するために局所GCを行い,複数のプロセッサにまたがるごみを回収するのに大域GC(参照カウントや大域マークスイープ)を行う.局所GCのそもそもの動機は,特に大規模な並列計算機では高価である,プロセッサ間の協調や通信をできるだけ避けることであるため,それらは一般に各プロセッサによって独立にスケジュールされることが多い(独立スケジュール方式).しかし,我々の実験結果はそのようなスケジュール方式は,通信遅延に敏感なアプリケーションの性能を大きく低下させることを示している.この原因は,そのようなスケジュールによって,GC中のプロセッサが,入ってくるメッセージに対して反応が遅くなることにある.一方で,全プロセッサが同時にごみ集めを行う,同期スケジュール方式は,それによって余分な同期やごみ集めのための仕事が生じるにもかかわらず,はるかに頑強な性能特性を示す.さらに,アプリケーションの通信挙動を観測することで,実行時に望ましいスケジューリング戦略を選ぶことが可能であることを示す.
著者
塙 敏博 中島 研吾 大島 聡史 伊田 明弘 星野 哲也 田浦 健次朗
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:21888841)
巻号頁・発行日
vol.2016-HPC-156, no.10, pp.1-10, 2016-09-08

東京大学情報基盤センターでは,データ解析・シミュレーション融合スーパーコンピュータシステム Reedbush を導入し,2017 年 3 月より全系稼働開始予定である.Reedbush システムは,Intel Xeon E5 (Broadwell-EP) プロセッサに加えて NVIDIA Tesla P100 (Pascal) GPU を一部計算ノードに搭載する他,高速ファイルキャッシュシステムや,InfiniBand EDR などを始めとして導入時点で最新の技術を集めたシステムである.本稿では 2016 年 7 月から稼働を開始した汎用 CPU のみからなる Reedbush-U サブシステムの性能について報告する.
著者
田浦 健次朗
出版者
一般社団法人情報処理学会
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.40, no.2, pp.197-199, 1999-02-15
著者
板持貴之 三輪誠 田浦健次朗 近山隆
雑誌
第74回全国大会講演論文集
巻号頁・発行日
vol.2012, no.1, pp.209-210, 2012-03-06

近年,イラスト投稿サイトと呼ばれるサービスを通じ,様々なイラストがインターネット上で閲覧できる.そのようなサービスにおいては,投稿者の情報(作者情報) と共にイラストが投稿されることが多いが,作者の検索を行うときは作者名などのキーワードを知らなければ検索ができないのが現状である.そこで本研究では,作者情報が未知のイラスト画像を入力し,そのイラストの作者らしい作者のランキングを出力する画像認識システムを提案する.画像認識システムの認識手法としては,イラストの作者情報をラベルとした教師あり学習を用いる.本論文では特に,その学習に用いる,作者を識別するためのイラストの特徴量に焦点を当てて提案・評価を行う.
著者
遠藤 亘 田浦 健次朗
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC) (ISSN:21888841)
巻号頁・発行日
vol.2017-HPC-160, no.37, pp.1-10, 2017-07-19

本研究では,分散共有メモリ (Distributed Shared Memory, DSM) システムと分散スレッドスケジューラを統合したライブラリを開発し,並列分散環境において透過的でスケーラブルな共有メモリプログラミングを実現することを目指している.従来の DSM 処理系で問題となってきたコヒーレントキャッシュの低スケーラビリティを改善するため,スレッド依存関係に基づいた緩和型コンシステンシモデルを基本として,計算ノードをまたいだ動的負荷分散とコヒーレンスプロトコルによる通信を協調させる手法を導入する.DSM の実装において今回はページベース DSM とし,ディレクトリベースのコヒーレンスプロトコルを実装する.分散スレッドスケジューラにはユーザレベルスレッドを用い,DSM 上にコールスタックを配置することで透過的スレッド移動を実現する.このような実装手法により,利用者にはユーザレベルスレッドやヒープ領域の生成・破棄等の API が 提供され,マルチコアプロセッサ上のタスク並列処理系相当の生産性を分散環境において実現できる.また,並行開発した HPC インターコネクト用の低水準通信ライブラリを基礎として,RDMA の利用を踏まえた DSM とスケジューラの実装を行う.本稿では,開発した処理系において共有メモリのベンチマークプログラムを動作させて初期評価を行い,その結果を元に性能上の今後の課題について論ずる.