- 著者
-
本木 雄斗
荒井 幸代
- 出版者
- 人工知能学会
- 雑誌
- 人工知能学会全国大会論文集 (ISSN:13479881)
- 巻号頁・発行日
- vol.31, 2017
マルチエージェント系のうち,各々のタスク達成の過程で行動の競合が生じる問題を対象とする.譲歩含む協調行動を強化学習によって獲得させるには,他者の行動や状態の共有が必要となるが状態空間が膨大となる.そこで本論文では,協調行動を報酬関数の設計によって獲得させることを考える.具体的には,Abbeelの逆強化学習をマルチエージェント系に導入する際に生じる問題を指摘し,これらの問題を回避する方法を提案する.