- 著者
-
三塩 武徳
小谷 善行
- 雑誌
- 研究報告ゲーム情報学(GI)
- 巻号頁・発行日
- vol.2014-GI-31, no.4, pp.1-6, 2014-03-10
ゲームの不完全情報の推定を行うアルゴリズム Using Past Playout(UPP) を提案する.UPP はモンテカルロ法において過去のシミュレーション結果のうち現在局面に至るものを取り出し,仮定した情報の間の勝率を比較する.相手側の勝率が高い部分は実際の局面と等しい可能性が高い.これを使って不完全情報の推定を行う.アレックス・ランドルフ (Alex Randolph) [1] によって発表された二人零和確定不完全情報ゲームである 「ガイスター」 において UPP を用いたプログラムと既存手法の猪突戦法,および通常のモンテカルロ法とで対局を行った.結果,猪突戦法に対しては思考時間 0.25 秒で 94%の勝率,モンテカルロ法との対局ではお互いの思考時間 1 秒で 55%の勝率を挙げた.これらの結果より,ガイスターにおける UPP の有効性を示した.