著者
荒井 幸代 鈴木 香名子 大喜多 周
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.26, 2012

ナッシュ均衡が複数存在するゲームでは,エージェントが最適な唯一の解に収束するためのインセンティブが必要となる。本稿では,スタグハントゲームを用いてエージェントが協力してスタグ(鹿)を狙うように導く報酬関数を逆強化学習によって推定する方法を提案する.また,本手法に対して,通常のQ学習において「スタグを狙う行動を獲得させる」報酬を試行錯誤的に設計する方法とを比較し,提案手法の有用性を示す