- 著者
-
水上 直紀
鶴岡 慶雅
- 雑誌
- ゲームプログラミングワークショップ2016論文集
- 巻号頁・発行日
- vol.2016, pp.81-88, 2016-10-28
本論文では強化学習を用いた麻雀プレイヤを構築する方法について述べる.初めに手牌から和了点数を予測するモデルを生成した牌譜から学習する.このモデルの結果と期待最終順位を用いて効率的な和了を行う手をプログラムは選択する.このモデルの結果と期待最終順位を用いて効率的な和了を行う手をプログラムは選択する.得られたプログラムは高い点数を和了する技術を獲得したものの,自己対戦の結果は元のプログラムに勝ち越すことはできなかった.