著者
水上 直紀 鶴岡 慶雅
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.81-88, 2016-10-28

本論文では強化学習を用いた麻雀プレイヤを構築する方法について述べる.初めに手牌から和了点数を予測するモデルを生成した牌譜から学習する.このモデルの結果と期待最終順位を用いて効率的な和了を行う手をプログラムは選択する.このモデルの結果と期待最終順位を用いて効率的な和了を行う手をプログラムは選択する.得られたプログラムは高い点数を和了する技術を獲得したものの,自己対戦の結果は元のプログラムに勝ち越すことはできなかった.

言及状況

はてなブックマーク (2 users, 2 posts)

Twitter (5 users, 5 posts, 0 favorites)

https://t.co/0W1ZEqlDdX 麻雀超初心者向けサイト
@kazucchi4465 https://t.co/y1BwuZ6naL 去年10月でこんなの出てきたけど試行錯誤って感じなのかな・・・
バイト中に論文読んでるのなんかじわる https://t.co/elULPfLU0W
単独で出していたのか気づいてなかった https://t.co/KJ2rhrJptn

収集済み URL リスト