- 著者
-
上田 隆一
- 出版者
- 東京大学
- 雑誌
- 若手研究(B)
- 巻号頁・発行日
- 2005
本研究課題は,最適制御問題を動的計画法で解いた解「状態行動地図」のメモリ容量を不可逆圧縮の代表的な手法であるベクトル量子化で圧縮するというものである.本年度は,申請者らの既発表のアルゴリズムの応用と評価を中心に研究を行い,成果を国内外の学会において発表し,今後雑誌論文として発表できる様々なデータを得た.本年度は,開発したアルゴリズムを大規模な問題へ適用し,評価を行った.その一つとして,ロボットサッカーでのマルチエージェント系となるタスク(パス)に本手法を適用した.状態行動地図の要素数は6億程度となったが,これを3.0GHz CPU,3.0GBのRAMを搭載した計算機で10日間計算することで,パスや互いに衝突を回避するなどの協調行動が見られる状態行動地図を得ることができた.また,この状態行動地図を同計算機で1日で圧縮することに成功し,結果的に実装するロボットのメモリ量(16MB)を下回る,8.2MBのベクトル量子化地図を得ることができた.また,シミュレーションではあるが,圧縮による地図でもロボットが協調して効率よく作業できることを示すことで,提案手法が,複雑なタスク用の地図を破綻させないで小さく圧縮できることを示せた.さらに,非常に非線形な制御問題であるアクロボットの振りあがりタスク,上記のロボットサッカーのタスク,人工知能の標準問題の一つである水たまりタスクにおいて,本手法と競合する手法との比較を行った.評価指標として,圧縮率と圧縮による性能劣化を計測した.結果,本手法で得られるベクトル量子化地図は,タスクの種類にかかわらず,他手法よりも安定して低消費メモリで性能劣化の小さい行動決定手法を記憶できることが示せた。