著者
前島 英雄 松本 秀和 大沼 邦彦 喜田 祐三
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.21, no.3, pp.208-215, 1980-05-15
被引用文献数
1

本論文では 制御用16ビットマイクロコンピュータに関し 特に制御用として重要な高速演算性能および高信頼性を得るLSIアーキテクチャについて述べる.本マイクロコンピュータは 既存のミニコンピュータと同一の命令体系を維持しながらNチャネルMOSデバイスによって製造する2種のカスタムLSIを基本要素として構成される.LSIの論理方式は コンピュータ・アーキテクチャと同様にプロセッサの処理性能に大きな影響を与えるものである.そこで 高速演算の実現に対し プロセッサ全体の論理構造を命令フェッチ用LSI(IFCU)と命令実行用LSI(RALU)の2つの論理機能に分割するアーキテクチャを採った.また LSI内部では加算回路のキャリ高速伝播方法を提案し マイクロ・サイクル・レベルでの高速化も示す.これによりカスタムLSIが パイプライン制御(命令実行中に次の命令フェッチを並行して行う)機能を備え 300nsのマシン・サイクル時間で動作するための技術を示す.結果として このLSIを用いたマイクロコンピュータは レジスタ・メモリ間加算命令2.3μs ギブソン・ミックス6.8μs の高速性能を達成する.更に 高信頼性の実現に対しては カスタムLSIへRAS機能をオン・チップ化するアーキテクチャを提案する.これによりマイクロコンピュータの部品としてのLSI が単なるデータ処理に止らず 主記憶保護やシステム監視などのエラー検出・処理をも行うことで制御用としての特長を活かし得ることを示す.
著者
小守 継夫 若林 正樹 天野 英晴
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告計算機アーキテクチャ(ARC) (ISSN:09196072)
巻号頁・発行日
vol.1999, no.21, pp.1-6, 1999-03-04
参考文献数
4
被引用文献数
1

慶應義塾大学では並列計算機の性能評価を目的に,並列計算機シミュレータライブラリISISと相互結合網シミュレータライブラリSPIDERを開発している.本研究では,これらのライブラリを利用して分散共有メモリ型並列計算機モデルであるNUMAのシミュレーションを行うため,新たな機能ブロックとしてネットワークインタフェースを開発してライブラリの拡張を行った.本稿では,ライブラリの拡張方法と,実装した幾つかのシミュレータ上でSPLASH2プログラム集を実行して性能評価を行った結果を示す.本研究により,様々な相互結合網について命令レベルシミュレーションによる性能評価を可能にした.A instruction level simulation library "ISIS" which is developed by Keio University supports to simulate a bus connected multiprocessor. On the other hand, "SPIDER" which is also developed by us supports to simulate an interconnection networks. Here, these two simulation libraries are combined to simulate a large scale multiprocesor connected with an interconnection network. We also implemented several distributed shared memory mulitprocessor simulator based on the new library. In this paper, the new extension method of library is described, and performance evaluation of the implemented simulator is shown.
著者
小林 悠記 小林 真輔 坂主 圭史 武内 良典 今井 正治
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.45, no.5, pp.1311-1321, 2004-05-15
被引用文献数
14

本稿では,コンフィギュラブルなVLIW プロセッサのアーキテクチャモデルに基づいたプロセッサ仕様記述から,合成可能なHDL 記述を生成する手法を提案する.本生成手法では,パイプラインステージの数やスロットの数,発行された命令を適切なリソースに割り付けるディスパッチ処理のルールなどを変更することが可能である.これらの変更パラメータや各命令の動作は,プロセッサ仕様記述中に表現されてり,VLIW プロセッサのパイプライン制御を含む制御部,命令デコーダ部,データパスはこのプロセッサ仕様記述から生成される.提案手法で用いるプロセッサ仕様記述の記述量は小さく,変更量もまた小さいため,提案手法を用いることで,設計者は効果的に設計空間探索をすることができる.評価実験では,約8 時間で36 種類のプロセッサ仕様を記述でき,その記述量は生成されるHDL 記述の記述量と比較して約82%削減できることを確認した.This paper proposes a synthesizable HDL code generation method using a processor speciffication description based on a configurable VLIW processor model.The proposed approachcan change the number of pipeline stages,the number of slots,and a dispatching rule that manages issued operations assigned to resources,and these parameters and each instruction behavior are represented in the processor specification description.The control logic including the pipeline controller,the decode logic,and the data path for VLIW processor are generated from the processor specification.Designers can explore ASIP design space using the proposed approach effectively,because the amount of description is small and the modification cost is also small.Using this approach,it took about eight hours to design 36 VLIW processors. Moreover,this approach provides a 82%reduction on the average compared to the description of the HDL code.
著者
垂水 浩幸 鶴身悠子 横尾 佳余 西本 昇司 松原 和也 林 勇輔 原田 泰 楠 房子 水久保 勇記 吉田 誠 金 尚泰
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.48, no.1, pp.110-124, 2007-01-15
参考文献数
10
被引用文献数
8

市販のGPS 付携帯電話を端末とした位置依存の共有仮想空間(擬人化エージェント機能や利用者間コミュニケーション機能を含む)を応用して観光支援システムを開発し,これについて公開実験を行った.ここで公開実験とは,観光者に現地で依頼して被験者となってもらい,かつ観光者自身の所有する携帯電話を使用して,我々の提供するサービスを評価してもらう実験であり,観光の観点から客観性の高い現実的な評価を得ることが目的である.実験は香川県の代表的観光地である金刀比羅宮と栗林公園でそれぞれ1 週間ずつ実施した.その結果,年齢,性,観光地への訪問経験などにより反応が異なる場合があることが確認でき,ターゲットユーザの絞り込みが重要であることが分かった.また仮想空間で提供する情報は,ガイドブックや立て看板などの現実のメディアとの役割分担が重要であることも明確になった.またGPS の誤差については問題が残るが,位置誤差の評価と観光支援サービスの評価は独立であることも確認した.本論文ではこの公開実験の方法と結果について詳細に述べる.We have developed a sightseeing support system, using our shared virtual world service including human-like agents and inter-user communication for popular GPS-phones on the market. We have conducted open experiments for the service. By open experiments, we mean those with real tourists as subjects and letting them use their own phones. By open experiment, we have aimed to acquire realistic and objective evaluation from the viewpoint of sightseeing itself. The experiments were conducted at two major sightseeing destinations in Kagawa prefecture, each taking one week. As results, we have found that visitors responded differently by their age, gender, experiences, etc. We have also found that virtual media should give different information from real media. These findings will help the future design of such services. GPS inaccuracies were found but subjects evaluated them independently from other evaluation. In this paper, the method and results of the experiments are described.
著者
松尾 勇気 石川 裕
出版者
一般社団法人情報処理学会
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2014, no.4, pp.1-4, 2014-02-24

時間発展シミュレーションは定期的に計算結果を出力するため、巨大なデータが生成される。そのデータサイズを縮小するため、データ圧縮技術が使われているが、ある時間ステップにおいて書き出すデータの隣接する値の類似性を活用している。本研究では、予測器に基づいた既存の高速な浮動小数点圧縮アルゴリズムを基にした時系列データ圧縮器 t-FPC を提案する。圧縮率を向上させるため、1 つの時間ステップに出力される中間データを、同一の時間ステップのデータ内部のものではなく、最近の複数の時間ステップで出力されたデータ間の差分を用いて圧縮を行う点でそれとは異なる。さらに、書き出す差分データ全体の bit 長の分布から可変サイズでデータを書き出すことにより圧縮率を向上する。また、連続して同じ値の場合、時間ステップの出力が全て同じ値の場合には、特別なエンコーディングをすることにより、圧縮率をさらに向上させる。時間発展シミュレーションである SCALE 気象・気候モデルの実際のファイル出力データを用いた評価により、t-FPC は、既存の浮動小数点データ専用の圧縮器や一般のデータ圧縮器に比べて、圧縮率や処理スループットの観点において、良い性能を達成していることを示す。Time evolution simulations generate a large amount of data periodically to ouput results. Existing compression techniques reduce data size by utilizing the similarity among the neighboring values inside the data that is written at one time step. In this paper, we propose t-FPC, a time-series data compression method that adapts the existing predictor based fast floating point compression algorithm. Compared to previous compression methods, it differs in the aspect that it compresses the intermediate result of one time step utilizing the finite differences among the data of recent multiple time steps, instead of those inside the data at the same time step in order to increase the compression ratio. In t-FPC, diffs are compressed with eight kinds of bit lengths. Those are determined based on bit length distribution of diffs. Special encoding is introduced for the two cases: one is that an element at one time step is the same as the previous time step, and another is that all elements at one time step is completely the same as the previous time step. Using the SCALE weather and climate model, it is shown that t-FPC achieves better processing speed and compression ratio than other data compressors including a famous floating point compressor.
著者
山川 太一 宮路 祐一 上原 秀幸
出版者
一般社団法人情報処理学会
雑誌
研究報告ユビキタスコンピューティングシステム(UBI) (ISSN:09135685)
巻号頁・発行日
vol.2013, no.43, pp.1-5, 2013-05-09

アドホックネットワークは多様な端末によって構成されるため,全方位性アンテナを搭載した端末 (全方位性端末) と,可変指向性アンテナを搭載した端末 (指向性端末) が混在した環境を許容する必要がある.しかし,このような環境における難聴や Head-of-Line(HOL) ブロッキングのような問題は,これまでに報告されていない本研究では,異種アンテナ混在アドホックネットワークにおいて,指向性端末が難聴となることによって全方位性端末で HOL ブロッキング問題が発生することを示す.この問題を解決するため,送信端末は難聴によって CTS パケットが受信できなかったとき,キューの中にある宛先の異なるパケットを先に送信する,日和見的なメディアアクセス制御手法を提案する.難聴は宛先が指向性端末のとぎのみに発生する.そこで,提案手法は宛先端末のアンテナの種類を用いて,他の宛先へのパケットを先に送信するかを決める.計算機シミュレーションから,提案手法は,IEEE 802.11DCF に比べて,スループットが約 28%向上した.Ad-hoc networks have terminals with various antenna capabilities such as omni-directional antenna and directional one. However, in ad-hoc networks with heterogeneous antennas, the Medium Access Control (MAC) layer problems such as deafness and Head-of-Line (HOL) blocking problem are not discussed. In this study, we argue HOL blocking problem due to deafness in ad-hoc networks with heterogeneous antennas. For solving the problem, we propose an opportunistic MAC protocol. In this protocol, if a sender does not receive CTS frame because of deafness, it attempts transmission to other destination. Deafness occurs only if the destination has directional antenna. The proposed MAC protocol uses the antenna type of the destination for determining whether the sender transmits to other destination or not. As a simulation result, the proposed MAC protocol achieves about 28% higher throughput than IEEE 802.11 DCF.
著者
坂口 琢哉 石崎 俊
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告数理モデル化と問題解決(MPS) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.130, pp.9-12, 2004-12-20
参考文献数
9

大規模なスポーツのリーグ戦などで試合日程を作成する際,考慮すべき要素の一つに各チームの移動距離の最小化が挙げられる.本稿ではこの問題を組み合わせ最適化問題と捉え,ニューラルネットワークを用いて総移動距離の短い試合日程を作成するモデルを提案した.提案モデルにおいて,試合日程作成のために必要不可欠な制約は制約層のニューロン,一方チームの長距離移動抑制や連続した同一対戦試合の禁止といった付加的な条件は側抑制として符号化した.また,本モデルを日本のプロ野球のセ・リーグ公式戦日程に適用した結果,総移動距離が現状に対し約60%であるような試合日程を作成できた.When creating the schedule of a major sports league or so, the minimization of total travel cost for each team is one of the most important factors we should consider. In this study we regarded this problem as combinational optimization problem, proposed a model with neural network architecture creating a schedule with keeping total travel cost low. We encoded several constraints essential for consistent scheduling as neurons in a constraint layer, while additional factors inhibiting long-range travel or same match-up series as lateral inhibition. We applied this model to the schedule of NPB(Nippon Professional Baseball) Central League, and succeeded to create a schedule in which total travel cost was about 60% compared to the real schedule.
著者
丸一 威雄 市川 正紀 所 真理雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.31, no.12, pp.1768-1779, 1990-12-15
被引用文献数
6

魚の群れ スポーツのチームプレイ 会社組織など 主体的に活動する複数の個体が協調しながら問題解決を行うシステムを表現する組織計算モデルを提案する組織計算モデルは 個体の自律性を向上させるメッセージ・インタプリタ および不特定多数との通信を実現する環境の概念を導入した並行オブジェクト計算モデルであるこの計算モデルでは 各個体(自律的エージェントと呼ぶ)は自分の判断で主体的に仕事を処理し 個体間で生じた問題の解決は各個体の意志決定を中心に行うという特徴がある本論文では この組織計算モデルの分散協調問題解決への応用例と分散環境での実現方法についても述べる
著者
宮川 大輔 石川 裕
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告システムソフトウェアとオペレーティング・システム(OS) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.79, pp.65-72, 2005-08-03
被引用文献数
2

DVS(Dynamic Voltage Scaling)はCPUの動作電圧および動作周波数を変えることで計算機の消費電力を下げる技術である。このDVSを用いてプロセス単位でCPUの動作周波数を変えることが出来れば、応答性能を下げることなく消費電力量を下げることが可能となる。しかし、その実用可能性を示すためにはCPU毎のDVSの性質とプロセス毎に動作周波数を変えるために必要なオーバーヘッドについての評価が不可欠となる。本論文では二つの実験を行ない、プロセス単位電力制御の実用可能性について予備的に評価する。DVSを用いたときのプログラムの電力量(電力の時間積分値)を測定し、Pentium 4とPentium Mの電力的性質を示す。次に、周波数の異なる二つのプロセスを同時に実行した時と別々に実行した時の電力量の違いを測定する。結果として、Pentium Mプロセッサを用いればプロセス単位電力制御機構をほぼオーバーヘッドなしに実現可能であることを示す。The DVS(Dynamic Voltage Scaling) is the technique that decrease power consumption of a computer by changing operating voltage and frequency. If we controlled the operating frequency on process base by using DVS, we would be able to decrease the power consumption without slowing response. However, in order to show its availability, we have to evaluate the DVS's properties of CPU and overheads necessary to change the operating frequencies on process base. In this research, we perform two experiments and preliminarily evaluate the availability of the Per-Process Power Consumption Control Mechanism. First, we look through the electricity characteristics of Penium 4 and Pentium M by measuring the total power consumption (temporal integration of power consumption per unit of time) when using the DVS. Second, we measure the difference of total power consumption of two processes with different frequencies, between simultaneous execution and sequential execution. As a result, we conclude that the Per-Process Power Consumption Controlling System is realized with almost no overhead if we use a Pentium M processor.
著者
宮川 大輔 石川 裕
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告システムソフトウェアとオペレーティング・システム(OS) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.48, pp.167-168, 2005-05-27
参考文献数
2
被引用文献数
1

最新の計算機では,消費電力やその結果発生する熱の問題が無視できなくなっている.プロセス毎にCPUの動作電圧を制御することで,計算機全体の消費電力を減らせる可能性がある.本研究では,プロセス毎の電圧制御が動作し,実用上有用であること,すなわち i) 電力消費を抑えられることii) オーバーヘッドが無視できるほど小さいこと をLinux Kernel 2.6を用いて示す.In modern computers, we cannot ignore the problem of power consumption and the emitted heat. By controlling process-based voltage, the power consumption of whole systems can be reduced. In this work, we present using Linux Kernel 2.6.8 that the per-process voltage control works well and is effective: i.e. i) we can control the consumption and ii) the overhead for controlling is moderate enough to ignore.
著者
宮川 大輔 石川 裕
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告システムソフトウェアとオペレーティング・システム(OS) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.86, pp.109-115, 2006-07-31
被引用文献数
4

計算機の消費電力低減が重要な課題となっている現在,OSレベルの電力制御手法が必要である.本論文ではOSレベルの電力制御手法として,電力制御スケジューラPCCSのプロトタイプを実装する.PCCSでは,OSは各プロセスの実行状況を監視し,そのプロセスに最適な動作速度を動的に決定する.CPUの動作周波数は実行プロセスの動作速度に基づいて変更される.単純なWebサーバにおける実験の結果,本プロトタイプが応答性能を下げずに消費電力の増大を既存実装の36%に抑え,手動設定による理想的なケースとも遜色がないことが示された.Reducing power consumption of computers is one of the most important issues. OS level power consumption control is necessary. As one of those methods, we develop the prototype of the PCCS (Power Consumption Controlling Scheduler). In PCCS, OS monitors the execution state of each process and automatically decides it's operating speed, The frequency of CPU is changed in accordance with that information. Experiments using a simple Web server showed that the prototype reduces the power consumption to 36% without lowering interactiveness. Those experiments also showed that the prototype is equivalent to the ideal case in which the frequency of each process isset by hand.
著者
久光 徹 丹羽 芳樹
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.107, pp.85-90, 2000-11-21
参考文献数
4
被引用文献数
5

与えられた文書集合を特徴付ける単語を選出することは,様々に応用できる有用技術である。「文書集合を特徴付ける」を,「文書集合中に特異的に多く現れる」と解釈し,これを捉えるために,文書集合D中の単語wに対し,以下の確率値に基づく重み付けを提案する。すなわち,全文書D_0中の単語数をN,wのD_0中での頻度をK,Dの単語数をn,wのD中での頻度をkとしたとき,「N個の玉の中にK個の赤い玉があるとき,任意に取り出したn個の玉の中に赤い玉がk個以上含まれる確率」が小さいほど,wに大きな重みを与えるのである。この指標の有効性を,5指標に関する比較実験により示し,併せて上記の確率の効率的計算方法を述べる.This paper proposes a method of selecting "characteristic words" from a document set. The selection is done by using the weight that is assigned to each word in the document set. The weight is calculated by using the hypergeometric distribution. A comparative evaluation of five methods of word weighting (including tf-idf and SMART) revealed that the proposed method is superior to existing methods. An effiecient method of calculating the hypergeometric probability is also shown.
著者
和田 勉
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータと教育(CE) (ISSN:09196072)
巻号頁・発行日
vol.1998, no.69, pp.41-48, 1998-07-31
参考文献数
1
被引用文献数
2

情報処理学会情報処理教育委員会・初等中等情報教育委員会での、高等学校に新設される「情報」教科のあるべき内容を示すことを目的としたモデル教科書執筆プロジェクトの一部として、執筆の一部:情報B(2)「プログラムとは何か」および情報C(2)「複雑なプログラムの実現」が私に割り当てられた。これを受けて執筆した初稿の要約を示す。これに対し今まで、タートルグラフィックス、LOGO、指導の手法等に関し批判・意見がよせられた。それらと、それに対し私が思うところ等を述べる。As a part of an IPSJ comittee's project for writing a textbook on the subject "Information" which will be established as a new subject in senior high schools, which is the project for the sake of showing its ideal content, I was alloted to write some parts: Information B(2) "What is a program" and Information C(2) "Realizing complicated programs." The abstracts of the first draft, which I have written in corresponding to it, are shown. Some arguments for it, especially on turtle graphicss, LOGO, and leading method, have been given. I will introduce them and describe some my arguments on them.
著者
根本 雄介 秋田 祐哉 河原 達也
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.73, pp.63-68, 2006-07-08
被引用文献数
6

広範な話題からなる会議音声を話題単位に自動分割し,得られた話題ごとに単語辞書と言語モデルの適応を行う手法を提案する.音声認識結果に対してPLSA(Probabilistic Latent Semantic Analysis)を適用して,話題を表す特徴ベクトルに変換し,その類似度に基づいて話題分割を行う.そして,話題ごとに類似したテキストを収集して,単語辞書を更新するとともにN-gram 言語モデルの適応を行う.衆議院予算委員会の音声で評価を行った結果,提案手法により単語辞書・言語モデルの適応を行うことで,ベースラインから未知語率を約25%,テストセットパープレキシティを約9%削減することができた.We address a vocabulary and language model adaptation method based on topic segmentation of meetings that include various topics. The ASR result is segmented based on the similarity among the feature vectors that were extracted with PLSA (Probabilistic Latent Semantic Analysis). The relevant texts (newspaper articles) for each topic segment are retrieved. The vocabulary and N-gram language model are updated with this retrieved texts. Experimental evaluation on a meeting of the Lower House Budget Committee showed that the proposed model adaptation based on topic segmentation reduced the test-set OOV rate and perplexity.
著者
掘 敦史 手塚 宏史 石川 裕
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.40, no.5, pp.2072-2083, 1999-05-15
参考文献数
36
被引用文献数
2

本稿の貢献は2つある. 1つはギャングスケジューリングの高速化技法の提案である. もう1つはギャングスケジューリングの実践的なアプリケーションによる評価である. 提案された高速化技法により クラスタ並列計算機上でギャングスケジューリングによる時分割スケジューリングが実用になりうることを示すことが本稿の目的である. ネットワークプリエンプションによるギャングスケジューリングの実現は ユーザレベル通信による高性能な通信と 時分割スケジューリングによるマルチプログラミング環境を同時に実現する. 本稿では ネットワークプリエンプション方式におけるスケジューリングオーバヘッドの大半が ネットワークコンテキストのメモリへの退避およびメモリからの復帰にあることを示すと同時に 複数のネットワークコンテキストを単に切り替えることでネットワークコンテキストの切替え時間を短縮する方式を提案する. この高速化技法の効果は NAS並列ベンチマークプログラムを用いて評価され その結果 高速化技法によりスケジューリングオーバヘッドが半減され 同時に2次キャッシュのヒット率も向上することが確認された. 評価の結果では 64ノード 100 msecの時分割間隔において スケジューリングオーバヘッドは4%以下であった.There are two contributions in this paper. One is to propose an efficient gang scheduling implementation technique, and the other is to evaluate gang scheduling overhead using some practical application programs. The purpose of this paper is to demonstrate that the overhead of gang scheduling on a cluster using commodity computers can be low enough for its practical use. Network preemption technique for implementing gang scheduling realizes high-performance communication and multi-programming environment with time-sharing scheduling. In this paper, it is shown that the most of the scheduling overhead comes from saving and restoring network contexts when preempting network. And then, it is proposed to switch network contexts to avoid high-cost saving and restoring network contexts. This proposed technique is evaluated using NAS parallel benchmarks. The results show that the scheduling overhead is almost halved and secondary cache miss ratios are decreased. The evaluated gang scheduling overhead is less than 4% on 64 nodes with a 100 msec time slice.
著者
宇都宮 直樹 円光 豊 高津 弘幸 助川 直伸
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告システムソフトウェアとオペレーティング・システム(OS) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.21, pp.37-42, 2000-02-24
参考文献数
5

バリア同期機構を使用したSR8000特有の並列アプリケーションプログラムをマルチプログラミング環境で効率的にサポートするギャングスケジューラを実装し、実アプリケーションプログラムによる性能測定を実施した。特に、空間分割と時分割を混合した新たなスケジューリング方法を提案・実装し、性能評価の結果、有効性を示すことができた。The gang scheduler is implemented to support high-performance execution of SR8000 parallel application programs. The new scheduling policy with both benefits of space slicing and time slicing is presented and evaluated. It is shown that the new policy can amortize the additional performance penalty with the help of user-level hints and further improvement.
著者
堀 敦史 手塚 宏史 石川 裕
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.39, no.9, pp.2705-2717, 1998-09-15
参考文献数
25

我々はシステムコールのオーバヘッドを削除したユーザレベル通信と,並列処理に有効とされるギャングスケジューリングに着目し,時分割多重並列プログラミング環境を構築した.本稿では,そのような並列プログラミング環境を構築する際の問題点を明らかにし,ユーザレベル通信とギャングスケジューリングという両者の利点を最大限に活かす手法として,「ネットワークプリエンプション」を提案する.ネットワークプリエンプションとは,並列プロセス切替え時に,プロセスのコンテキストのみならずネットワークのコンテキストをも退避/復帰しようとするものである.PCクラスタ上の評価結果では,500msecの時分割間隔において約2%のスケジューリングオーバヘッドであることが判明した.本稿で提案されたネットワークプリエンプションは,ギャングスケジューリングだけでなく,分散プロセスの大域状態検出などへの応用が考えられる.The goal of this research is the implementation of high-performance and easy-to-use parallel programming environment. We focus on the user-level communication technique and gang scheduling.In this paper,first we clarify some problems when implementing the user-level communication and gang scheduling,and then we propose network preemption that can extract the both benefits of the user-level communication and gang-scheduling.The network preemption is to save and restore network context when switching parallel processes.The proposed scheme is implemented on our PC cluster.On our evaluation on the PC cluster,gang-scheduling overhead is about 2% when the time slice interval is 500 msec.The proposed network preemption can be applied for not only gang scheduling,but also global state detection.
著者
福地 健太郎 松岡 聡 堀 敦史 石川 裕
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告計算機アーキテクチャ(ARC) (ISSN:09196072)
巻号頁・発行日
vol.1998, no.18, pp.43-48, 1998-03-05
参考文献数
10

Implicit co?schedulingはBerkeley NOWプロジェクトで提案された、大域スケジューラーを持たず、オーバーヘッドが少い・実装が容易である等の利点を持つ並列ジョブスケジューリング技法である。これまでの性能評価では実行時間の対ギャングスケジューリング比にして0.6?1.6程度の性能が出るとされているが、実用的なアプリケーションでの性能評価はなされていない。本研究では、大規模高性能クラスター上で、NAS並列ベンチマークを用いる事で、implicit co?schedulingの実践的な性能を測定した。その結果、FT,CGにおいて実行時間の対ギャングスケジューリング比にして最大2.3倍という結果を得ており、Berkeleyの評価が再現しなかった。これは、ネットワークの混雑等が原因と予測され、現在追試中である。Implicit co-scheduling is a parallel job scheduling methodology proposed by the UC Berkeley NOW project, and embodies favorable characterlistics such as lack of global schedulers, low overhead, and easy implementation. Previous literatures have claimed that overhead versus traditional gang schedulers was about a factor or 0.6 to 1.6; however, evaluations were not performed using real-life workloads. We have implemented an implicit co-scheduler on a large-scale, high-performance cluster, and used NAS parallel benchmarks to measure effective performance. There, we found that for FT and CG, the overhead versus gang scheduling can be as high as factor of 2.3, negating the Berkeley results. We conjecture that this is due to excessive network traffic, but are still in the process of perforoming additional experiments.
著者
堀 敦史 手塚 宏史 石川 裕
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.1997, no.75, pp.79-84, 1997-08-19
参考文献数
13
被引用文献数
4

我々は,メッセージ通信型のプログラミングを対象としたギャングスケジューラを開発した.本稿は,開発したギャングスケジューラのスケジューリングオーバヘッドについて,PCクラスタ上で評価した結果について報告するものである.評価の目的は,アプリケーションの通信特性の違いがギャングスケジューリングのオーバヘッドに与える影響,実装された方式のスケーラビリティ,および co?scheduling skewの3点に注目した.今回の評価の結果,通信の量による違いよりも.co?scheduling skewの影響が大きいことが判明した.スケーラビリティの面においては,2プロセッサで動作する並列アプリケーションで比較的大きなオーバヘッドが見られたが,多くの場合,100 msecの量子時間でオーバヘッドは10%以下であり,4台以上の場合では,スケーラビリティに問題は見られなかった.We have developed a gang-scheduler for message passing programs. This paper reports on evaluation results of our gang-scheduler running on a PC cluster. We focus on, i) how communication patterns affects gang scheduling overhead, ii) scalability, and iii) co-scheduling skew. Through the evaluation, we found that effect of co-scheduling skew can be larger than effect of the amount of messages communicating. Also we found larger overhead with applications running on two processors, however, we could not find any scalability problem with applications running more than two processors. In most cases, implemented gang scheduling overhead is less than 10% with 100 msec time quantum.