著者
佐伯 裕治 清水 正明 白沢 智輝 中村 豪 高木 将通 Balazs Gerofi 思 敏 石川 裕 堀 敦史
出版者
一般社団法人情報処理学会
雑誌
研究報告システムソフトウェアとオペレーティング・システム(OS)
巻号頁・発行日
vol.2013, no.15, pp.1-7, 2013-04-18

メニーコアプロセッサ向けの OS として,Linux カーネルと軽量カーネルが連携して管理するヘテロジニアス構成の OS を開発している.軽量カーネル上においても Linux カーネルのシステムコールを提供するために,軽量カーネルで実現されない Linux システムコールの処理は Linux カーネルに委譲する.引数がデータ領域を示すシステムコールの場合,転送が必要なデータの構造は API 仕様に依存するため,300 種類以上の Linux 互換システムコールに個別に対応したデータ転送を実装する必要がある.本稿では,システムコール処理対象となるデータを同一仮想アドレスへのメモリマップを行う方式により,軽量カーネルに個々のシステムコール処理を実装することなく Linux カーネルに委譲する機構と,その基本評価結果について報告する.We have been developing a heterogeneous OS composed of Linux and lightweight kernels for manycore processor. In order to provide all Linux system calls in the lightweight kernel, those primitives which are not provided by the lightweight kernel are delegated to the Linux kernel. Each system call differs in the number of arguments and argument types, and thus the code transferring arguments and results is implemented in each delegating system call. It is impractical to implement all Linux APIs, i.e., more than 300 system calls. Therefore, we developed a delegation mechanism of system calls without individual implementation to pass the data between the lightweight kernel and Linux using a memory mapping technique. In this technique, a user-level virtual address space in the lightweight kernel is mapped to the same position in a Linux process. We report the result of basic evaluation of system calls on lightweight kernel developed on Intel(R) Xeon PhiTM Coprocessor.
著者
齋藤 智之 石川 裕 Gerofi Balazs 三好 建正 大塚 成徳 富田 浩文 西澤 誠也 八代 尚
出版者
一般社団法人情報処理学会
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2014, no.2, pp.1-6, 2014-02-24

実時間ゲリラ豪雨予測システムを実現するために,100 ケースの 30 秒アンサンブル気象シミュレーション結果と 30 秒毎の最新気象観測データを同化し,その結果から 30 分後の気象予測をする.将来の並列計算機において,5000 プロセスから構成される気象シミュレーションジョブと 5000 プロセスから構成されるデータ同化ジョブの間でデータ転送が行われると見積もっている.ファイル渡しによる非効率なデータ転送ではなく,ファイル I/O API を維持しながら 2 つのジョブのプロセス間で効率の良いデータ転送を提供する File I/O Arbitrator を提案する.We are designing and developing an innovative real-time severe weather forecasting system that updates 30 minute later severe weather conditions every 30 second. In this system, the results of 100 cases of 30 second ensemble numerical weather simulations and observational data obtained by modern weather equipment's are assimilated every 30 minute, and 30-second weather prediction is performed using the assimilated data. In a next generation supercomputer we assume, it is estimated that data are transferred between 100 case ensemble simulations running on 5000 processes and an assimilation job running on 5000 processes in order to meet required realtimeness in terms of computation. Shortening the execution time of simulations and assimilation, the execution time of transferring data via files becomes bottleneck. In this paper, efficient data transfer middleware called file I/O arbitrator is proposed in order to eliminate exchanging files.
著者
大野 善之 堀 敦史 石川 裕
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2011-HPC-132, no.34, pp.1-6, 2011-11-21

並列ジョブにおける多数ファイルに対する I/O をひとつのファイルに対する I/O に集約することによりファイル I/O を高速化する方式を提案する.各プロセスごとにファイルを作成し,データを書き出すというファイル I/O パターンをとるアプリケーションが多くある.しかし,現在普及している並列ファイルシステムは,少数の大きなデータ I/O で高い性能がでるように設計されており,プロセスごとにファイルを作成するという I/O パターンでは高い性能がでない.そこで,並列ジョブにおけるファイル I/O をひとつのファイルに集約し,少数の大きなデータ I/O にする方式を提案する.Lustre 上で予備評価を行った結果,並列プロセスがそれぞれ 1MB のファイルを 128 個 I/O する場合,2-3 倍の性能向上を確認した.
著者
岡家 豊 木村 かず子 石川 裕
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告システムソフトウェアとオペレーティング・システム(OS) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.80, pp.53-60, 2003-08-04
被引用文献数
4

IPMIイニシアティブが規格しているIPMI (Intelligent Platform ManagementInterface)は、ボード上の温度、電圧、冷却ファンなどを監視するハードウェア仕様である。IPMI規格は、信頼性、可用性、保守性、管理性を備えたいわゆるディペンダブルシステムを実現するハードウェア支援技術である。ディペンダブルシステムを実現するには、故障診断ツール、監視通報ツールなどの管理保守系システムソフトウェアが必要である。このようなシステムソフトウェアを開発するためには、開発段階から想定している機器故障に対応する機能が仕様通りに動作しているか確認するテスト環境が必須である。我々は、管理保守システムソフトウェアの開発と同時に機器故障を模擬するシミュレータも開発している。故障シミュレータは、IPMI規格で定義されているセンサ情報やベンダ固有情報に基づいて人工的に情報を生成する。故障シミュレータは、Linuxカーネル上の一プロセスとして稼働するUser Mode Linuxのカーネルモジュールとして実現される。IPMI (Intelligent Platform Management Interface specification), defined by IPMI Initiative, is the specification of hardware that observes temperature, voltage, cooling fan, and so on. The IPMI specification supports hardware mechanisms that realizes a reliable, available, and manageable system so-called dependable system. To realize such a dependable system, it is necessary to develop maintenance system software, such as a diagnostic tool, watchdog and reporting tool, and so on. To develop such system software, a testing environment is required, which allows us to check whether functions corresponding to failures assumed on the developing stage work well. We are developing the failure simulator of machinery and tools as well as the maintenance system software. Based on the sensor information and vendor proprietary information defined in IPMI, the failure simulator generates information artificially. The failure simulator is implemented as kernel modules of User Mode Linux that works as a process on the native Linux kernel.
著者
堀 敦史 山本 啓二 大野 善之 今田 俊寛 亀山 豊久 石川 裕
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2011, no.6, pp.1-8, 2011-07-20

エクサスケールを視野に置いた、メモリや通信の遅延を隠蔽するための新しいマルチスレッドライブラリを提案する。そのためにはサブマイクロ秒でのスレッド制御を可能にする必要がある。本稿では、スレッドスケジューリングとして、プロセッサの Simultaneous Multi-Threading 機能を用い、ハードウェアによる高速なスレッドスケジューリングを用い、また、スレッド間の同期機構として Intel 製のプロセッサが提供する monitor/mwait 命令を用いた新しいスレッドライブラリ、Shadow Thread を提案する。高速な同期と低消費電力を両立させるため、同期フラグを spin-waitとmonitor/mwait 命令を組み合わせた 2-phase の同期機構が有効であることを示す。この方式を用いて開発された Shadow Thread は、メモリ領域のコピーにおいて、最大約 20% の高速化に成功した。Towards the Exa-scale computing, a new thread library is proposed to hide the latencies of memory and communication. For this purpose, thread management must be fast enough in the order of sub-micro seconds. In this paper, the thread library, named Shadow Thread, is developed so that it utilizes Simultaneous Multi-Threading mechanism which schedules threads by hardware in a very fast way and utilizes the monitor and mwait instructions supported by some Intel processors. It is shown that the two-phase synchronization technique combining the conventional spin-wait method and the pair of the monitor/mwait instructions can satisfy the requirement of speed and low-power consumption simultaneously. Evaluation shows that a memory copy function using the Shadow Thread library can exhibit better performance up to 20% compared with the normal memcpy function.
著者
堀 敦史 石川 裕 NolteJörg 原田 浩 古田 敦 佐藤 忠
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告システムソフトウェアとオペレーティング・システム(OS)
巻号頁・発行日
vol.1994, no.106, pp.25-32, 1994-12-08

超並列OSにおけるプロセス間通信では,仮想記憶管理機構の技法を用いたプロセス間共有メモリによるプロセス間通信の高速化技法が必ずしも使えないことや,プロセスのスケジューリングに注意しないと効率的なプロセス間通信が実現できないなどといった,逐次マシンのOSとは異なる側面を持っている.本稿では,超並列OS上での効率的なプロセス間通信を実現するために,"buddy"と"alternate"という2種類のプロセスグループを提案する.Buddyプロセスグループはパイプライン処理,alternateプロセスグループはプロセス間共有メモリを可能とする.同時に,alternateプロセスグループを用いたスケーラブルな並列デバッガ実行モデルの提案も併せておこなう.Inter-process communication on a massively parallel operating system have some different aspects from that on a sequential system. For example, the virtual memory management technique for efficient inter-process communication that can be seen in the Mach micro kernel can not be implemented on a distributed memory parallel machine. Process scheduling is also very important to realize efficient inter-process communication. In this paper, we propose 2 kinds of process groups, "buddy" and "alternate" to realize efficient inter-process communication. The buddy process group is suitable for pipeline processing, while the alternate process group enables inter-process shared memory. Also, we propose a scalable parallel debugger execution model based on the alternate process group.
著者
堀 敦史 石川 裕 Nolte Jorg 原田 浩 古田 敦 佐藤 忠
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. CPSY, コンピュータシステム
巻号頁・発行日
vol.94, no.383, pp.25-32, 1994-12-08

超並列OSにおけるプロセス間通信では,仮想記憶管理機構の技法を用いたプロセス間共有メモリによるプロセス間通信の高速化技法を必ずしも使えないことや,プロセスのスケジューリングに注意しないと効率的なプロセス間通信が実現できないなどといった,逐次マシンのOSとは異なる側面を持っている.本稿では,超並列OS上での効率的なプロセス間通信を実現するために、"buddy"と"alternate"というに種類のプロセスグループを提案する.Buddyプロセスグループはパイプライン処理,alternateプロセスグループはプロセス間共有モメリを可能とする.同時に,alternateプロセスグループを用いたスケーラブルな並列デバッガ実行モデルの提案も併せておこなう.
著者
西尾 勝 新藤 宗幸 三宅 博史 五石 敬路 高井 正 棚橋 匡 木村 佳弘 川手 摂 田中 暁子 萬野 利恵 畑野 勇 小石川 裕介
出版者
公益財団法人後藤・安田記念東京都市研究所
雑誌
基盤研究(B)
巻号頁・発行日
2010

本研究は、「平成の市町村合併」が一段落した現時点において、「平成の市町村合併」がなにをもたらしたのかについて、多面的に把握するために、地域区分変更に関する国際比較を行うとともに、行政(職員数、職種別職員数、行政組織、施設)、財政(普通会計、特別会計、公営企業)及び住民負担、政治(議会議員及び首長の属性)について、それぞれデータベースを作成した。併せて、中央省庁、都道府県、市町村の合併事務担当者などにヒアリング調査を行った。「合併」の効果と喧伝された諸事項は、非合併自治体との比較ではあまり見ることはできなかった。また、行政と住民の距離感が開くなどの「合併の弊害」と想定された項目に対する定数特例や選挙区、地域自治組織などの諸措置は、措置自体の時限性や行政改革の帰結として、事実上剥落していった。以上の分析結果から、「平成の市町村合併」とは、「究極の行財政改革」を市町村に推進させるためのツールであった、と評価できる。
著者
前田 宗則 小中 裕喜 石川 裕 友清 孝志 堀 敦史
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. 記号処理研究会報告
巻号頁・発行日
vol.93, no.81, pp.17-24, 1993-09-17

本稿では,循環参照カウント方式(CRC)を基礎とする新しいGCアルゴリズムCRC_<IW>を提案する.CRCは,ポインタによる循環構造も含めた任意の使用不能なメモリブロック(オブジェクト)を回収可能なGC方式であるが,対象言語がコンビネータに制限されること,循環構造を管理するアルゴリズムが逐次的であることという二点により,並列マシン上の一般の高級言語にはそのまま適用できなかった.CRC_<IW>は,各オブジェクトに順序数を与えることで任意の言語に適用可能とし,複数のプロセスによって並列に循環構造を管理するようアルゴリズムを拡張している.さらに,分散メモリを持つ並列マシンにおいてGCによる通信オーバーヘッドを低減するために,参照を3タイプに分けて管理することと各参照に重みを与えることが考察される.
著者
前田 宗則 小中 裕喜 石川 裕 友清 孝志 堀 敦史
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. [プログラミング-言語基礎実践-]
巻号頁・発行日
vol.93, no.73, pp.113-120, 1993-08-19

参照カウント方式ゴミ集めは,アプリケーションが生成する参照に循環構造が存在しないことを前提とする既に広く知られたゴミ集め技法である.これまでに,循環参照を取り扱えるよう拡張された循環参照カウント方式が提案されているが,アルゴリズム上その方式の適用可能な計算モデルがコンビネータマシンに限定される問題がある.本稿では,オブジェクト指向言語を含めて,参照の循環を任意の時点で引き起こすようなポインタ操作を許す言語に対する循環参照カウント方式ゴミ集めを提案する.さらに本方式は,ゴミ集めの並列処理と重み付き参照による参照複製に関して考察し,並列/分散環境のための基礎を与える.
著者
石川 裕
出版者
社団法人 プラズマ・核融合学会
雑誌
プラズマ・核融合学会誌 (ISSN:09187928)
巻号頁・発行日
vol.79, no.8, pp.759-764, 2003 (Released:2005-09-28)
参考文献数
4

This paper introduces an overview of the SCore cluster system software running on the Linux operating system. SCore utilizes PC cluster hardware efficiently and provides its users a high-performance parallel programming environment. This paper also presents brief installation information for the end-users.
著者
手塚 宏史 堀 敦史 O-CarrollFrancis 石川 裕
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告計算機アーキテクチャ(ARC) (ISSN:09196072)
巻号頁・発行日
vol.1998, no.18, pp.25-30, 1998-03-05
参考文献数
20
被引用文献数
8

我々はPentium Pro 200MHzのPC64台をMyrinetギガビットネットワークによって接続したPCクラスタシステム"RWC PC Cluster II"を構築し,その上にマルチユーザの並列プログラミング環境SCoreを開発している.PCC2上の通信ライブラリPMは通常のメッセージ転送だけでなくリモートメモリライトによるゼロコピーデータ転送をサポートしており,約119Mバイト/秒(Kバイトデータ)のメッセージ転送バンド幅と約109Mバイト/秒(同8Kパイト)のリモートメモリライトバンド幅,および約7.5マイクロ秒(同8バイト)の通信レイテンシを持っている.また,PMのこれらの機能を用いたMPI/PMはPCC2上で約104Mバイト(同1Mバイト)のデータ転送バンド幅と約11マイクロ秒(同8バイト)の通信レイテンシを得ている.MPI/PMを用いたNASパラレルベンチマークの結果によって,PCC2の高い性能とスケーラビリティが実証された.We have built a PC cluster "RWC PC Cluster II" consisting 64 Pentium Pro 200MHz PCs connected by a Myrinet giga-bit network, and have been developing a multi-user parallel programming environment SCore on it. A communication library PM on PCC2 supports a message passing and a remote memory write using zero-copy data transfer. PM achieves 119M bytes/s (8K byte data) message passing bandwidth, 109M bytes/s (8K byte data) remote memory write bandwidth and 7.5 micro second communication latency. MPI/PM that uses these PM facilities achieves 104M bytes/s (1M byte data) data transfer bandwidth and 11 micro second communication latency on PCC2. The NAS parallel benchmark results using MPI/PM have shown PCC2's high performance and scalability.
著者
Brunet Pierre 石川 裕一郎
出版者
慶應義塾大学大学院法務研究科
雑誌
慶應法学 (ISSN:18800750)
巻号頁・発行日
no.20, pp.279-292, 2011-08

翻訳1. 価値秩序としての憲法という概念2. 装置としての憲法という概念3. 規範としての憲法という概念4. 憲法と憲法制定権力5. 憲法解釈
著者
高橋延匡 武山潤一郎 並木美太郎 中川正樹 石川 裕
雑誌
研究報告 システムソフトウェアと オペレーティング・システム(OS)
巻号頁・発行日
vol.2011, no.2, pp.1-6, 2011-07-20

今後の高性能計算機においては,数十から数百以上のコアを集積したメニーコア環境が重要な役割を負う.メニーコア環境では,これまでのマルチコア環境とは違った OS カーネルやシステムソフトウェアが要求されるが,それらの開発の際に必要な実験向けメニーコア環境は,現在はまだ一般に入手できない.このような状況でも OS の開発を進めるために,本研究ではアクセラレータタイプのメニーコア環境を FPGA を用いてシミュレーションするシステムを設計する.また,HDL による実装の前段階として,Gem5 フルシステムシミュレータ上にメニーコア環境をモデリングする.Manycore processors, which have more than dozens of cores, will play large role in high-performance computing (HPC) in near future. Manycore environments require kernels and other system software to be designed differently from multicore counterpart. However, manycore environments that are necessary to develop those system softwares is not generally available currently. Our study aims designing and implementing a simulator of manycore environment in FPGA for those system software development. Prior to implementing the system in FPGA, we model the manycore processor on Gem5 full-system simulator.
著者
下沢 拓 石川 裕 堀 敦史 並木 美太郎 辻田 祐一
雑誌
研究報告 システムソフトウェアと オペレーティング・システム(OS)
巻号頁・発行日
vol.2011, no.1, pp.1-7, 2011-07-20

本稿では,メニーコア混在型システム向けのオペレーティングシステムのためのハードウェア抽象化層 AAL を設計する.AAL は,抽象化による移植可能性の向上を目的とし,抽象化層の摸擬環境を作成することによりメニーコア混在型システム向けのオペレーティングシステムの開発を可能にする.さらに,マルチコアシステムでメニーコア混在型システムを摸擬した環境での AAL の実装についても述べる.AAL, an abstraction layer of operating systems for manycore accelerators is designed in this report. AAL is aimed to provide portability of operating systems for manycore accelerators. AAL enables development of the operating systems without any manycore accelerators by implementing emulation of the layer. An implementation of AAL for a manycore emulation environment on a multicore CPU is also presented.