著者
藤居 祐輔 安積 卓也 西尾 信彦 加藤 真平
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.55, no.2, pp.1048-1058, 2014-02-15

サイバーフィジカルシステム(CPS)が注目される中,その技術基盤として,GPUなどのデバイスが利用され始めている.GPUはデバイスドライバを経由して利用されているが,CPSのように短い周期で繰り返し多くの処理が行われると,ホストへの負担が増えるとともに,デバイス制御や処理の同期によってレイテンシが発生する.さらにGPU処理では,データをデバイスメモリへと転送する必要があり,上記問題を悪化させ,データ転送処理自体にも影響を与える.そのため我々は,GPU制御処理の一部をGPUマイクロコントローラ上で動作するファームウェアへオフロードし,GPU処理の効率化をめざす.本論文では,オフロード基盤としてコンパイラ,デバッグ支援ツールを含んだGPU制御ファームウェア開発環境と,既存のNVIDIA社製ファームウェアと同等の機能を持つファームウェアを開発する.次に,オフロード基盤を用いて,制御処理の一部であるDMA転送処理をファームウェアに追加実装することで,オフロードを実現しGPU処理を効率化する.我々は,実装したファームウェアと既存のファームウェアを比較し,性能低下がないことを示すことで,オフロード基盤の有効性を確認した.オフロードしたデータ転送処理では,既存のデータ転送処理と比べ,一部のデータサイズにおいて約1.5倍の転送速度を実現し,さらに既存データ転送処理へのオーバラップ転送を実現した.
著者
梅尾 寛之 水頭 一壽 武田 瑛 加藤 真平 山崎 信行
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DC, ディペンダブルコンピューティング (ISSN:09135685)
巻号頁・発行日
vol.108, no.464, pp.55-60, 2009-02-26

リアルタイム処理用プロセッサResponsive Multithreaded Processorは,スレッド数が8スレッド以内であればコンテキストスイッチを行わずに優先度順に同時実行可能なRMT実行機構を持つ.しかしながら,9スレッド以上を実行する場合,ソフトウェアスケジューラによってコンテキストスイッチを行わなければならない.また周期タスクのリリースの為にはソフトウェアスケジューラを定期的に呼び出し,リリース時間をチェックしなければならない.本論文では,RMT Processorを対象としたハードウェアによるスレッドスケジューリング機構の設計と実装について述べる.本スレッドスケジューリング機構では,RMT ProcessorのプロセッシングコアであるRMT PUが全スレッドの周期を保持し,周期スレッドをハードウェアで起床させる.更に,コンテキストキャッシュ内のスレッドと実行スレッドを比較し,ハードウェアでコンテキストスイッチを行う.本スレッドスケジューリング機構によってソフトウェアによるスケジューリングを不要とし,スケジューリングオーバヘッドを大幅に削減する.
著者
梅尾 寛之 水頭 一壽 武田 瑛 加藤 真平 山崎 信行
出版者
一般社団法人情報処理学会
雑誌
研究報告組込みシステム(EMB) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.22, pp.55-60, 2009-02-26

リアルタイム処理用プロセッサ Responsive Multithreaded Processor は,スレッド数が 8 スレッド以内であればコンテキストスイッチを行わずに優先度順に同時実行可能な RMT 実行機構を持つ.しかしながら,9 スレッド以上を実行する場合,ソフトウェアスケジューラによってコンテキストスイッチを行わなければならない.また周期タスクのリリースの為にはソフトウェアスケジューラを定期的に呼び出し,リリース時間をチェックしなければならない.本論文では,RMT Processor を対象としたハードウェアによるスレッドスケジューリング機構の設計と実装について述べる.本スレッドスケジューリング機構では,RMT Processor のプロセッシングコアである RMT PUが全スレッドの周期を保持し,周期スレッドをハードウェアで起床させる.更に,コンテキストキャッシュ内のスレッドと実行スレッドを比較し,ハードウェアでコンテキストスイッチを行う.本スレッドスケジューリング機構によってソフトウェアによるスケジューリングを不要とし,スケジューリングオーバヘットを大幅に削減するResponsive Multithreaded Processor for real-time processing can execute eight threads simultaneously in priority order without context switching. When over nine threads are executed, context switching is required. A real-time scheduler should be called periodically and release times of all tasks are checked. This paper proposes thread scheduling scheme for RMT Processor. RMT PU, which is processing core of RMT processor, holds the periods of all threads and starts threads by hardware without periodic calls of the scheduler. In addition, threads in context cache are compared with threads in execution, and context switching will be realized by hardware. Our thread scheduling scheme reduces scheduling overheads so that traditional software scheduling can be unnecessary.