ゲームの不完全情報推定アルゴリズムUPPとそのガイスターへの応用

5 0 0 0 OA ゲームの不完全情報推定アルゴリズムUPPとそのガイスターへの応用

著者: 三塩武徳小谷善行
雑誌: 研究報告ゲーム情報学(GI)
巻号頁・発行日: vol.2014-GI-31, no.4, pp.1-6, 2014-03-10

ゲームの不完全情報の推定を行うアルゴリズム Using Past Playout(UPP) を提案する.UPP はモンテカルロ法において過去のシミュレーション結果のうち現在局面に至るものを取り出し,仮定した情報の間の勝率を比較する.相手側の勝率が高い部分は実際の局面と等しい可能性が高い.これを使って不完全情報の推定を行う.アレックス・ランドルフ (Alex Randolph) [1] によって発表された二人零和確定不完全情報ゲームである「ガイスター」において UPP を用いたプログラムと既存手法の猪突戦法,および通常のモンテカルロ法とで対局を行った.結果,猪突戦法に対しては思考時間 0.25 秒で 94%の勝率,モンテカルロ法との対局ではお互いの思考時間 1 秒で 55%の勝率を挙げた.これらの結果より,ガイスターにおける UPP の有効性を示した.

2019-02-19 02:15:55
5 + 3 Twitter

http://id.nii.ac.jp/1001/00099261/

言及状況

Twitter (5 users, 6 posts, 3 favorites)

と、思って調べてみると、ガイスターのAIを研究している人もいた。モンテカルロ法の発展型のアルゴリズムらしい。｜ゲームの不完全情報推定アルゴリズムUPPとそのガイスターへの応用 https://t.co/KgsCmXGMlx

3 @KaRaSu0 @Kuchitama

3 @JMAN_TS @KaRaSu0 @suekichi

後で | 情報学広場：情報処理学会電子図書館 ( ゲームの不完全情報推定アルゴリズムUPPとそのガイスターへの応用) https://t.co/3QN2e2PLQ8

収集済み URL リスト

https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=99283&item_no=1&page_id=13&block_id=8 (5)