- 著者
-
齋藤 雄太
鶴岡 慶雅
- 雑誌
- ゲームプログラミングワークショップ2016論文集
- 巻号頁・発行日
- vol.2016, pp.196-200, 2016-10-28
事前知識を用いない多人数不完全情報ゲームのAIの学習は、人工知能を現実世界の問題に応用する上で非常に重要な課題の一つである。本研究では、多人数不完全情報ゲームの一種であるトリックテイキングゲームの行動価値観数を線形関数で近似し、Q学習を行った。その結果、トリックテイキングゲームにQ学習を適用することで単純なルールベースのプレイヤに勝る結果が得られること、自己対戦による学習を行うことで、ランダムプレイヤによる学習を行った時よりも学習結果が向上することを示した。