著者
新堀航大 兵頭 和幸 砂山 享祐 三上 貞芳
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.50, no.3, pp.1170-1180, 2009-03-15

探査作業のような未知環境の下でロボットを用いるような研究が進められているが,ロボットのパーツの破損によって移動不可となる可能性などについては,まだ研究の余地が残されている.本論文では,ロボットが破損した場合でも,回収が困難な場合には破損部以外の利用可能なアクチュエータを用いることで移動法を再獲得するようなシステムを想定し,想定外の状況にもある程度適応できるような移動法獲得を,強化学習を用いて実現する.提案する手法では,脚形状から車輪形状などの想定外の形状へのアクチュエータモジュールの換装もある程度可能なシステムを前提とする.このような前提では新たな移動手順を広く探査することになるが,ロボットの移動機能を迅速に回復するためには,なるべく有用な行動を速く探査し利用することに重点を置く必要がある.このため,本研究では強化学習手法に対して,時間的信頼性に基づいた「行動価値の成長」と呼ぶ再探索手法を導入する.3D物理シミュレータによる6脚移動ロボットの実験により,提案する方法が比較的高速に良い候補となる移動法を獲得できていることが示されている.