著者
水上 直紀 鶴岡 慶雅
雑誌
ゲームプログラミングワークショップ2015論文集
巻号頁・発行日
vol.2015, pp.179-186, 2015-10-30

長期的な戦略に基づく手の決定は繰り返しゲームにおいて重要である.本論文では麻雀の繰り返しゲームの性質に着目して最終順位を考慮したコンピュータ麻雀プレイヤの構築法について述べる.牌譜中に現れた点数状況から最終順位を予測するモデルの学習を行う.モンテカルロ法のシミュレーションでの報酬を予測モデルの結果を用いることで最終順位に基づく手をプログラムは選択する.オンライン麻雀サイト「天鳳」で作成されたプログラムの実力を評価した結果,レーティングとして,中級者を超える1844点が得られた.

言及状況

はてなブックマーク (1 users, 1 posts)

Twitter (10 users, 10 posts, 0 favorites)

東京大学でマージャンのAIが考案されてる… https://t.co/7fa0ly5Lzb
勝ち負けとかでは無いが勝ち目無い https://t.co/Hfqc1hnIdv
https://t.co/4CLATaxtza 最後のページのTUREってのはTRUEかな まだ最善手にはなってないってことならCPU対戦はまだこの程度ってことなのかな
やる気でなさすぎるから天鳳レート1800オーバーな麻雀AIの論文読む https://t.co/eoECM1RLyX

収集済み URL リスト