著者
三塩 武徳 小谷 善行
雑誌
研究報告ゲーム情報学(GI)
巻号頁・発行日
vol.2014-GI-31, no.4, pp.1-6, 2014-03-10

ゲームの不完全情報の推定を行うアルゴリズム Using Past Playout(UPP) を提案する.UPP はモンテカルロ法において過去のシミュレーション結果のうち現在局面に至るものを取り出し,仮定した情報の間の勝率を比較する.相手側の勝率が高い部分は実際の局面と等しい可能性が高い.これを使って不完全情報の推定を行う.アレックス・ランドルフ (Alex Randolph) [1] によって発表された二人零和確定不完全情報ゲームである 「ガイスター」 において UPP を用いたプログラムと既存手法の猪突戦法,および通常のモンテカルロ法とで対局を行った.結果,猪突戦法に対しては思考時間 0.25 秒で 94%の勝率,モンテカルロ法との対局ではお互いの思考時間 1 秒で 55%の勝率を挙げた.これらの結果より,ガイスターにおける UPP の有効性を示した.

言及状況

Twitter (5 users, 6 posts, 3 favorites)

と、思って調べてみると、ガイスターのAIを研究している人もいた。モンテカルロ法の発展型のアルゴリズムらしい。 | ゲームの不完全情報推定アルゴリズムUPPとそのガイスターへの応用 https://t.co/KgsCmXGMlx
後で | 情報学広場:情報処理学会電子図書館 ( ゲームの不完全情報推定アルゴリズムUPPとそのガイスターへの応用) https://t.co/3QN2e2PLQ8

収集済み URL リスト