強化学習を用いた効率的な和了を行う麻雀プレイヤ

7 0 0 0 OA 強化学習を用いた効率的な和了を行う麻雀プレイヤ

著者: 水上直紀鶴岡慶雅
雑誌: ゲームプログラミングワークショップ2016論文集
巻号頁・発行日: vol.2016, pp.81-88, 2016-10-28

本論文では強化学習を用いた麻雀プレイヤを構築する方法について述べる.初めに手牌から和了点数を予測するモデルを生成した牌譜から学習する.このモデルの結果と期待最終順位を用いて効率的な和了を行う手をプログラムは選択する.このモデルの結果と期待最終順位を用いて効率的な和了を行う手をプログラムは選択する.得られたプログラムは高い点数を和了する技術を獲得したものの,自己対戦の結果は元のプログラムに勝ち越すことはできなかった.

http://id.nii.ac.jp/1001/00175308/

言及状況

はてなブックマーク (2 users, 2 posts)

[あとで読む]

Twitter (5 users, 5 posts, 4 favorites)

https://t.co/0W1ZEqlDdX 麻雀超初心者向けサイト

@kazucchi4465 https://t.co/y1BwuZ6naL 去年１０月でこんなの出てきたけど試行錯誤って感じなのかな・・・

バイト中に論文読んでるのなんかじわる https://t.co/elULPfLU0W

1 @pisatto2

単独で出していたのか気づいてなかった https://t.co/KJ2rhrJptn

7 0 0 0 OA 強化学習を用いた効率的な和了を行う麻雀プレイヤ

言及状況

はてなブックマーク (2 users, 2 posts)

Twitter (5 users, 5 posts, 4 favorites)

収集済み URL リスト