- 著者
-
三塩 武徳
小谷 善行
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 研究報告ゲーム情報学(GI) (ISSN:09196072)
- 巻号頁・発行日
- vol.2014, no.4, pp.1-6, 2014-03-10
ゲームの不完全情報の推定を行うアルゴリズム Using Past Playout(UPP) を提案する.UPP はモンテカルロ法において過去のシミュレーション結果のうち現在局面に至るものを取り出し,仮定した情報の間の勝率を比較する.相手側の勝率が高い部分は実際の局面と等しい可能性が高い.これを使って不完全情報の推定を行う.アレックス・ランドルフ (Alex Randolph) [1] によって発表された二人零和確定不完全情報ゲームである 「ガイスター」 において UPP を用いたプログラムと既存手法の猪突戦法,および通常のモンテカルロ法とで対局を行った.結果,猪突戦法に対しては思考時間 0.25 秒で 94%の勝率,モンテカルロ法との対局ではお互いの思考時間 1 秒で 55%の勝率を挙げた.これらの結果より,ガイスターにおける UPP の有効性を示した.We propose an algorithm Using Past Playout (UPP) which estimates incomplete information of the game. The algorithm UPP extracts the playouts of current position from the simulation results of the past, and compares the winning percentages between the assumed information. The higher the part the other side's winning percentage is, the higher the possibility equal to actual aspects is. It estimates the incomplete information with it. We performed experiment of playing using UPP, Foolhardiness (Chototsu) Tactics and normal Monte Carlo method in the game "geister", two person zero sum determined incomplete information game, which was invented by ALEX RANDOLPH[1]. As a result, UPP listed a winning percentage of 94% in 0.25 seconds thinking time against Foolhardiness (Chototsu) Tactics and 55% in one seconds thinking time for both against normal Monte Carlo method. The results show the effectiveness of the UPP in it.