- 著者
-
森本 淳
銅谷 賢治
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
- 巻号頁・発行日
- vol.82, no.11, pp.2118-2131, 1999-11-25
- 被引用文献数
-
42
人間のように多自由度の身体をもつロボットが,試行錯誤的に目的とする運動を獲得することは,ロボット学習の分野において大きな課題である.本論文では強化学習を用いて,ロボットが高次元状態空間中における運動学習を行うための手法,主に評価関数の近似方法についての考察を行う.制御タスクとしては,人間の身体の形を単純化した3リンク2関節ロボットの起き上がり運動を扱う.強化学習の一手法である,連続時間,連続状態のTemporal Difference学習則を,正規化ガウス関数を必要に応じて逐次配置する関数近似手法と組み合わせ,高次元連続状態空間中での起き上がり運動学習を行った.その結果,シミュレーション上で約2400回の試行後に起き上がり運動が獲得された.