著者
藤村 悠太朗 金子 知適
雑誌
ゲームプログラミングワークショップ2018論文集
巻号頁・発行日
vol.2018, pp.145-152, 2018-11-09

近年,環境から得た報酬を用いて学習を行う,強化学習の手法が盛んに研究されている.Deep Q-Network がAtari2600の様々なゲームで人間のプレイヤーを上回るスコアを達成したことが報告されており,より一般的なビデオゲームへの応用も期待されている.本研究は,世界的に有名なコンピュータゲームであるMinecraft上で動作するAIエージェントを研究対象とする.Minecraft のようなゲームは環境から報酬が与えられる機会が少なく,そのままでは学習が難しいという問題がある.この問題を解決するため,課題を階層的に分割することで模倣学習と強化学習を組み合わせる手法であるhg-DAgger/Qで学習するエージェントでの実験を行い,その性質を検討した.