著者
福本 健冶 池田 冶 小野 典彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. AI, 人工知能と知識処理
巻号頁・発行日
vol.96, no.77, pp.33-38, 1996-05-24
被引用文献数
1

近年, 強化学習を利用して, 未知の環境で振る舞うエージェント群に, 試行錯誤的に学習を行なわせ, それらの間に何らかの協調関係を組織化させることが試みられている. しかし各エージェントの状態空間は, そのタスクが他のエージェントとの連携をともない複雑化するにしたがい爆発してしまい, それらに効果的に強化学習を行なわせることはきわめて難しくなる. ここでは, 単純な強化学習の枠組みでは状態数が爆発してしまうマルチエージェントによる典型的な学習問題として, "追跡問題"をとりあげ, 各追跡者エージェント群に構造的Q学習を組み込むことによって, その状態空間の爆発を回避すると共に, それらに分業や群れ行動をともなう協調行動を獲得させることを試みる.