- 著者
-
山田 訓
渡邊 彰
塩野 悟
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会総合大会講演論文集
- 巻号頁・発行日
- vol.1995, no.1, 1995-03-27
- 被引用文献数
-
1
強化学習は事前情報や知識を用いずに、制御の評価だけを用いて、試行錯誤によって制御を自立的に獲得していく学習法である。従って、幅広い制御問題に適用できる可能性が高い。これまでに、倒立振り子の制御、迷路問題、バッグギャモンなどに適用されてきている。そこで、ロボットの制御などの実際問題に適用していく第一段階として、2自由度のマニピュレータに強化学習を適用したので報告する。