著者
水上 直紀 鶴岡 慶雅
雑誌
ゲームプログラミングワークショップ2015論文集
巻号頁・発行日
vol.2015, pp.179-186, 2015-10-30

長期的な戦略に基づく手の決定は繰り返しゲームにおいて重要である.本論文では麻雀の繰り返しゲームの性質に着目して最終順位を考慮したコンピュータ麻雀プレイヤの構築法について述べる.牌譜中に現れた点数状況から最終順位を予測するモデルの学習を行う.モンテカルロ法のシミュレーションでの報酬を予測モデルの結果を用いることで最終順位に基づく手をプログラムは選択する.オンライン麻雀サイト「天鳳」で作成されたプログラムの実力を評価した結果,レーティングとして,中級者を超える1844点が得られた.

言及状況

はてなブックマーク (1 users, 1 posts)

Twitter (13 users, 13 posts, 4 favorites)

水上直紀・鶴岡慶雅 (2015) 「期待最終順位に基づくコンピュータ麻雀プレイヤの構築」 https://t.co/0CzdTgReqP (2023年11月10日最終閲覧) ここで予測モデルの学習項目として具体化されている、 ①聴牌である確率②特定の牌が相手への当たり牌になる確率③予想される相手の和了点数… https://t.co/0ZFFRGZuBO
レーティングに関してはこの辺読んでくらさい https://t.co/O0BVfedAV7
東京大学でマージャンのAIが考案されてる… https://t.co/7fa0ly5Lzb
勝ち負けとかでは無いが勝ち目無い https://t.co/Hfqc1hnIdv
https://t.co/4CLATaxtza 最後のページのTUREってのはTRUEかな まだ最善手にはなってないってことならCPU対戦はまだこの程度ってことなのかな
やる気でなさすぎるから天鳳レート1800オーバーな麻雀AIの論文読む https://t.co/eoECM1RLyX

収集済み URL リスト