著者
山田 訓 渡辺 彰 中島 道夫 塩野 悟
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NC, ニューロコンピューティング
巻号頁・発行日
vol.94, no.40, pp.41-48, 1994-05-19

アメフラシえら引き込み反射の神経活動を光学多点計測し、得られたデータを再現する神経回路網モデルを構築したところ、この神経回路網にはディジタル的な応答特性を持つディジタル運動ニューロンとアナログ的な応答特性を持つアナログ運動ニューロンを共存していることがわかった。このディジタル・アナログ共存を用いたディジタル・アナログ協調型強化学習法を提案し、倒立振り子に適用したところ、アナログ出力によって、リミットサイクルに近い安定な動きを示す制御法を、ディジタル出力ニューロンと同程度の速さで学習することができた。
著者
山田 訓 渡邊 彰 塩野 悟
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会総合大会講演論文集
巻号頁・発行日
vol.1995, no.1, 1995-03-27
被引用文献数
1

強化学習は事前情報や知識を用いずに、制御の評価だけを用いて、試行錯誤によって制御を自立的に獲得していく学習法である。従って、幅広い制御問題に適用できる可能性が高い。これまでに、倒立振り子の制御、迷路問題、バッグギャモンなどに適用されてきている。そこで、ロボットの制御などの実際問題に適用していく第一段階として、2自由度のマニピュレータに強化学習を適用したので報告する。