著者
小林港 長名優子
出版者
一般社団法人情報処理学会
雑誌
全国大会講演論文集
巻号頁・発行日
vol.2012, no.1, pp.301-303, 2012-03-06

本研究では、Profit Sharingを用いて落ち物パズルゲームの1つであるぷよぷよの学習を行う。Profit Sharingのような強化学習では一般に試行錯誤を繰り返していくことで、報酬を得るためのルールを獲得していくが、ここでは、人間が実行した操作データをエピソードとして用いることで学習を行う。また、Profit Sharingにより獲得したルールを解析することで、学習に用いる操作データの違いにより、学習されるスキルの違いがみられることなどを確認する。