著者
地代 康政 出岡 宏二郎 塩谷 亮太 安藤 秀樹
雑誌
研究報告システム・アーキテクチャ(ARC) (ISSN:21888574)
巻号頁・発行日
vol.2016-ARC-219, no.14, pp.1-6, 2016-03-17

特性の異なる複数の実行系を単一コア内にそなえ,それらを使い分けることによってエネルギー効率を向上させる Tightly-Coupled Heterogeneous Cores(TCHCs) が提案されている.TCHCs の一つであるコンポジット・コアでは,インオーダとアウト・オブ・オーダのバックエンドを備えており,両者を切り替えて使用する.しかしコンポジット・コアはバックエンド切り替えペナルティや切り替えアルゴリズムの問題により,十分に消費エネルギーを削減できていない.この問題を解決するため,本研究では我々が提案してきた TCHC である Front-end Execution Architecture(FXA) をベースとして,低消費電力な実行モードを追加した Dual-Mode Front-end Execution Architecture(DM-FXA) と,そのためのモード切り替えアルゴリズムを提案する.提案手法を評価した結果,通常のアウト・オブ・オーダ・スーパスカラ・プロセッサと比較して 96.8%の性能を維持しつつ,平均 38.8%のエネルギー削減を達成した.
著者
船坂峻慈 中野浩嗣 伊藤靖朗
雑誌
研究報告システム・アーキテクチャ(ARC) (ISSN:21888574)
巻号頁・発行日
vol.2016-ARC-222, no.6, pp.1-6, 2016-09-29

データ圧縮はコンピュータエンジニアリングの分野で非常に重要である.しかし,多くの可逆圧縮と展開アルゴリズムは並列化が非常に難しい.本論文では Light Loss - Less (LLL) 圧縮と呼ぶ,新しい可逆圧縮法を提案する.この圧縮法の展開アルゴリズムは高い並列化が可能であり GPU を用いて非常に高速に処理することができる.データ展開は圧縮と比較して何度も行うためにこの圧縮法は多くのアプリケーションで応用できる.我々は LLL 展開の並列アルゴリズムを提案し GeForce GTX 1080 GPU に実装した.GPU を用いた LLL 展開の実効速度を Core i7- 4790 への逐次 CPU 実装と比較し 91.1-176 倍の高速化を達成した.また,よく知られている圧縮手法である LZSS と LZW との比較も行う.提案手法は圧縮率は同程度である一方で LZSS 展開の GPU 実装と比較して 4.30-14.1 倍,LZW 展開の GPU 実装と比較して 2.49-9.13 倍の高速化を達成した.
著者
前田 宗則 田邨 優人 松尾 勇気 佐藤 充 中島 耕太
雑誌
研究報告システム・アーキテクチャ(ARC) (ISSN:21888574)
巻号頁・発行日
vol.2016-ARC-221, no.29, pp.1-5, 2016-08-01

ユーザ空間から直接にハードウェアをボーリングするスレッドを立ち上げ,I/O リクエストに即時応答することで低レイテンシと高スループットを両立するカーネルバイパス型ソフトウェアアーキテクチャが注目されている.カーネルバイパス方式では,スレッド間の排他処理や実行割り当ては,性能に影響するため繊密な設計が必要とされる.これまでに我々は,低レイテンシなスレッド待ち合わせ処理を軽量スレッドとボーリングの組み合わせで実現する方式を提案している.本稿では,軽量スレッドと高速待ち合わせ機構をカーネルバイパス型アーキテクチャの一方式である DPDK に適用することで性能向上を実現した.
著者
溝田 敦也 城間 隆行 中島 拓真 吉見 真聡 策力 木格 吉永 努
雑誌
研究報告システム・アーキテクチャ(ARC) (ISSN:21888574)
巻号頁・発行日
vol.2016-ARC-221, no.36, pp.1-6, 2016-08-01

本研究では,インタークラウドを活用した迅速な災害復旧の仕組みを提案する.クラウド環境の普及に伴い,多数の重要なサーバがクラウド環境へ移行し,耐障害性の担保が重要な課題となっている.特に,大規模災害等によりクラウド基盤が壊滅的な被害を受けた場合は,遠隔地にある安全なクラウド基盤を活用して迅速にシステムを復旧できるのが望ましい.しかし,一般にクラウドシステムは複数のサーバで構成されるなど複雑化が進んでおり,煩雑な手順と長い復旧作業時間が要求される.そこで,本研究では複数のクラウドを横断して管理するクラウドオーケストレーシヨンを活用し,障害検知,システム再構築,データ復元のプロセスを自動化する仕組みを提案する.ブログサービスを対象にした予備実験の結果,災害発生後最短 9 分程度でシステムが自動で復旧可能であることを確認した.
著者
増山 滉一朗 藤田 悠 奥原 颯 天野 英晴
雑誌
研究報告システム・アーキテクチャ(ARC) (ISSN:21888574)
巻号頁・発行日
vol.2015-ARC-217, no.21, pp.1-6, 2015-10-01

バッテリー駆動デバイスのための高性能低電力アクセラレータとして silicon on thin BOX(SOTB) プロセスを用いて開発された,Cool mega array-SOTB-2(CMA-SOTB-2) について報告する.CMA-SOTB-2 は大規模な演算素子 (PE) アレイ,データ転送を管理するためのμコントローラ,およびデータメモリから構成される.今回導入したμコントローラ内のデータマニピュレータにより,データメモリヘの並列アクセスが可能となった.また遅延調整機構の導入により,PEアレイ内演算のための最適な遅延時間を容易に検出,設定できるようになった.実装においては,前回の試作機である CMA-SOTB の時のものよりもリーク電力が少ないセルライブラリを使用した.これにより実チップ評価にて,わずか 0.4mW の消費電力で 297 MOPS の性能を達成した.この電力効率は CMA-SOTB のほぼ倍である.CMA-SOTB-2はレモンを 3 つ使用したレモン電池により,およそ 0.3mW の電力で画像アプリケーションを動作させることが可能である.
著者
西村 秦 佐藤 雅之 江川 隆輔 小林 広明
雑誌
研究報告システム・アーキテクチャ(ARC) (ISSN:21888574)
巻号頁・発行日
vol.2015-ARC-216, no.38, pp.1-8, 2015-07-28

マルチコアプロセッサでは,ラストレベルキャッシュ (LLC) を複数のコアで共有している.このため,LLC 上には複数のスレッドで共有しているデータ (共有データ) が存在する.複数のスレッドからアクセスされる共有データは,単一のスレッドからしかアクセスされないデータ (私有データ) に比べ再利用性が高い.しかし,共有データと私有データの区別を行わないデータ管理では,私有データによる過剰なキャッシュ占有のため,共有データを十分に保存できずヒット率の低下を招く.そこで,本研究では,並列プログラムの実効性能向上を目的とし,複数のスレッドに共有されるデータとそれ以外のデータを LLC 上で個別に管理するキャッシュ機構を提案する.提案手法は,LLC 上のデータを共有データと私有データに分けて管理することで,再利用性の高い共有データを優先的に LLC に保持する.これにより,共有データのヒット率が向上し,並列プログラムの実効性能向上が期待できる.シミュレーションによる評価結果から,提案手法は,LRU 置換ポリシに基づくキャッシュ機構と比較して最大 1.70 倍,平均 1.13 倍の性能向上を可能にすることが明らかとなった.
著者
愛甲 和秀 木下 雅文 小島 剛 畑﨑 恵介
雑誌
研究報告システム・アーキテクチャ(ARC) (ISSN:21888574)
巻号頁・発行日
vol.2015-ARC-215, no.5, pp.1-7, 2015-05-19

昨今,注目度が高まっている並列処理システム Spark の障害復旧処理モデルでは,データ量やタスク処理時間に連動してダウンタイムが長くなる,可用性劣化が問題となる場合がある.本研究では,Spark の可用性劣化の原因となるデータ復旧処理時間を短縮するため,Spark のメモリ上のデータ管理をインメモリ KVS で代替する方法を提案する.本方法は,データ書き込み時のノード間でのインメモリデータ複製処理と,障害時のノード内のインメモリ KVS のデータ配置情報と Spark のデータ配置情報の同期処理により,上記復旧処理時間を短縮する.その結果,従来法では障害復旧時間が数分かかる場合においても,提案技術を適用することによりダウンタイムを常に5秒以内に維持できるとの評価結果を得た.以上の結果から,提案方法が Spark のダウンタイムが増加する可用性問題の解決に有効であることが明らかになった.
著者
平井 浩一 小田和 友仁 岡本 高幸 二宮 温 住元 真司 高木 将通 Balazs Gerofi 山口 訓央 小倉 崇浩 亀山 豊久 堀 敦史 石川 裕
雑誌
研究報告システム・アーキテクチャ(ARC) (ISSN:21888574)
巻号頁・発行日
vol.2015-ARC-215, no.2, pp.1-8, 2015-05-19

将来の HPC 向けの OS としては,メニーコアへの最適化が必須となってきており,それを実現するための OS として McKernel を選択し,計算センターにおけるバッチジョブ運用への適応を進めている.本論文では,将来のスーパーコンピュータ上で,McKernel に適応したバッチジョブ運用を実現する場合の課題を述べ,現状の検討状況について述べる.
著者
小柴 篤史 和田 基 坂本 龍一 佐藤 未来子 並木 美太郎
雑誌
研究報告システム・アーキテクチャ(ARC) (ISSN:21888574)
巻号頁・発行日
vol.2015-ARC-215, no.7, pp.1-8, 2015-05-19

本研究では,Just-In-Time コンパイラによる生成コードを対象に,コンパイラによる静的な解析だけでは考慮することが難しい分岐命令の挙動を VM 内で動的に解析し,実行命令列をより適切に把握することで電力削減効果を高めることのできる Geyser 向け細粒度パワーゲーティング制御手法を提案する.提案手法を Dalvik VM に実装し,CaffeineMark,SPECJVM ベンチマークを用いてエミュレータ上で電力性能の評価実験を行い,監視する分岐命令数に制約を設けない理想条件で平均リーク電力を最大 17% 削減した.
著者
広渕 崇宏 高野 了成 工藤 知宏
雑誌
研究報告システム・アーキテクチャ(ARC) (ISSN:21888574)
巻号頁・発行日
vol.2015-ARC-215, no.12, pp.1-6, 2015-05-19

システムソフトウェア分野において不揮発性メモリ技術に関する研究を進めるため,オペレーティングシステムのメモリアクセス傾向を把握する手法を開発した.オペレーティングシステムを改変することなく,そのメモリ読み書き速度や読み書きメモリページ番号を記録できる.ハードウェアが備えるメモリアクセス監視機能を用いて既存ハイパーバイザーを拡張することで実現した.CPU インストラクションを逐次分析する方式と比べて遙かに高速に動作する.試作を通じて提案機構の基本的な動作を確認できた.
著者
間下 恵介 三宅 翔 山田 遼平 津邑 公暁
雑誌
研究報告システム・アーキテクチャ(ARC) (ISSN:21888574)
巻号頁・発行日
vol.2015-ARC-215, no.13, pp.1-10, 2015-05-19

マルチコア環境では,一般的にロックを用いて共有変数へのアクセスを調停する.しかし,ロックには並列性の低下やデッドロックの発生などの問題があるため,これを補完する並行性制御機構としてトランザクショナルメモリが提案されている.この機構をハードウェア上で実現したハードウェアトランザクショナルメモリではアクセス競合が発生しない限りトランザクションが投機的に実行される.しかし,共有変数に対する複合操作が行われるようなトランザクションが並行実行された場合,その際に発生するストールが無駄となる場合がある.そこで本稿では,このような複合操作を検出し,それに関与するトランザクションを排他実行する手法に加え,同一の共有変数に対してそれ以降変更が行われないと判断した時点で,他スレッドによる投機的アクセスを許可する手法を提案する.シミュレーションによる評価の結果,提案手法により 16 スレッド実行時において最大 67.2%,平均 13.9% の性能向上を達成した.
著者
小久保 翔平 伊波 立樹 河野 真治
雑誌
研究報告システム・アーキテクチャ(ARC) (ISSN:21888574)
巻号頁・発行日
vol.2015-ARC-215, no.16, pp.1-6, 2015-05-19

本研究室では Code Gear, Data Gear を用いた並列フレームワークの開発を行なっている.Code Gear, Data Gear は処理とデータの単位である.並列実行に必要な Meta な機能を関数型言語における Monad の原理に基づいて,実現する.今回設計した Gears OS では Code Gear, Data Gear それぞれに Meta Code Gear と Meta Data Gear を対応させる.Code Gear が実行されるとそれに対応する Meta Code Gear が実行され,Meta Computation が行われる.Meta Computation は OS が行うネットワーク管理,メモリ管理等の資源制御を行う.本論文では基本的な機能を設計し,CbC(Continuation based C) で実装する.
著者
Masamichi Takagi Balazs Gerofi Norio Yamaguchi Takahiro Ogura Toyohisa Kameyama Atsushi Hori Yutaka Ishikawa
雑誌
研究報告システム・アーキテクチャ(ARC) (ISSN:21888574)
巻号頁・発行日
vol.2015-ARC-215, no.1, pp.1-8, 2015-05-19

Processor core count in high-end computing has seen a steady increase during the past decade and next generation supercomputers will likely deploy many-core based systems. At the same time, from a software environment point of view, Linux-compatibility has become wide-spread in the High Performance Computing (HPC) domain. We consider the challenges of operating system (OS) design targeting next generation high-end computing. We believe that the most urging issues to be addressed are as follows. (1) Exploiting deep memory hierarchies, (2) Reducing cache pollution by OS services and minimizing OS noise, (3) Making it easy to design and deploy application specific kernels, (4) Providing a Linux compatible programming / run-time environment and (5) Enabling seamless tracking of upstream Linux kernel changes. We contend that existing approaches to HPC operating systems, which either employ a stripped down Linux environment or a specific light-weight kernel built from scratch, are not feasible to deal with these challenges. In this paper, we discuss the design decisions of our proposed hybrid kernel design for providing a Linux-compatible light-weight kernel.