著者
本木 雄斗 荒井 幸代
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

マルチエージェント系のうち,各々のタスク達成の過程で行動の競合が生じる問題を対象とする.譲歩含む協調行動を強化学習によって獲得させるには,他者の行動や状態の共有が必要となるが状態空間が膨大となる.そこで本論文では,協調行動を報酬関数の設計によって獲得させることを考える.具体的には,Abbeelの逆強化学習をマルチエージェント系に導入する際に生じる問題を指摘し,これらの問題を回避する方法を提案する.