著者
佐藤 仁 小西 史一 山本 泰智 高木 利久 松岡 聡
雑誌
研究報告ハイパフォーマンスコンピューティング(HPC)
巻号頁・発行日
vol.2009-HPC-123, no.6, pp.1-7, 2009-11-23

TSUBAME 上で Hadoop を実行するためのツール 「Tsudoop」 を開発した.Tsudoop は,既存システムの構成や運用方針の変更をすることなく,TSUBAME 上のジョブスケジューラである n1ge や Lustre ファイルシステムなどと協調して動作して Hadoop 実行環境を構築し,ユーザの MapReduce アプリケーションを実行する.予備実験として,このツールを用いて,生物医学系の学術論文を対象にした書籍情報データベースである MEDLINE に対してテキストの全文検索を行うアプリケーションを実行した.その結果,1 ノード (16 コア) での実行と 32 ノード (512 コア) での実行とを比較して 14 倍の性能向上を示し,TSUBAME のような高速な共有ファイルシステムやジョブスケジューラが存在するような計算環境でも,MapReduce アプリケーションの実行が可能なことを確認した.

言及状況

はてなブックマーク (2 users, 3 posts)

熱いなぁ。こういう仕事やって見たい。 RT @shiumachi: スーパーコンピュータTSUBAME上でのMapReduceの実現 - 情報学広場:情報処理学会電子図書館
熱いなぁ。こういう仕事やって見たい。 RT @shiumachi: スーパーコンピュータTSUBAME上でのMapReduceの実現 - 情報学広場:情報処理学会電子図書館

収集済み URL リスト