著者
三塩 武徳 小谷 善行
雑誌
研究報告ゲーム情報学(GI)
巻号頁・発行日
vol.2014-GI-31, no.4, pp.1-6, 2014-03-10

ゲームの不完全情報の推定を行うアルゴリズム Using Past Playout(UPP) を提案する.UPP はモンテカルロ法において過去のシミュレーション結果のうち現在局面に至るものを取り出し,仮定した情報の間の勝率を比較する.相手側の勝率が高い部分は実際の局面と等しい可能性が高い.これを使って不完全情報の推定を行う.アレックス・ランドルフ (Alex Randolph) [1] によって発表された二人零和確定不完全情報ゲームである 「ガイスター」 において UPP を用いたプログラムと既存手法の猪突戦法,および通常のモンテカルロ法とで対局を行った.結果,猪突戦法に対しては思考時間 0.25 秒で 94%の勝率,モンテカルロ法との対局ではお互いの思考時間 1 秒で 55%の勝率を挙げた.これらの結果より,ガイスターにおける UPP の有効性を示した.
著者
三塩 武徳 小谷 善行
出版者
一般社団法人情報処理学会
雑誌
研究報告ゲーム情報学(GI) (ISSN:09196072)
巻号頁・発行日
vol.2014, no.4, pp.1-6, 2014-03-10

ゲームの不完全情報の推定を行うアルゴリズム Using Past Playout(UPP) を提案する.UPP はモンテカルロ法において過去のシミュレーション結果のうち現在局面に至るものを取り出し,仮定した情報の間の勝率を比較する.相手側の勝率が高い部分は実際の局面と等しい可能性が高い.これを使って不完全情報の推定を行う.アレックス・ランドルフ (Alex Randolph) [1] によって発表された二人零和確定不完全情報ゲームである 「ガイスター」 において UPP を用いたプログラムと既存手法の猪突戦法,および通常のモンテカルロ法とで対局を行った.結果,猪突戦法に対しては思考時間 0.25 秒で 94%の勝率,モンテカルロ法との対局ではお互いの思考時間 1 秒で 55%の勝率を挙げた.これらの結果より,ガイスターにおける UPP の有効性を示した.We propose an algorithm Using Past Playout (UPP) which estimates incomplete information of the game. The algorithm UPP extracts the playouts of current position from the simulation results of the past, and compares the winning percentages between the assumed information. The higher the part the other side's winning percentage is, the higher the possibility equal to actual aspects is. It estimates the incomplete information with it. We performed experiment of playing using UPP, Foolhardiness (Chototsu) Tactics and normal Monte Carlo method in the game "geister", two person zero sum determined incomplete information game, which was invented by ALEX RANDOLPH[1]. As a result, UPP listed a winning percentage of 94% in 0.25 seconds thinking time against Foolhardiness (Chototsu) Tactics and 55% in one seconds thinking time for both against normal Monte Carlo method. The results show the effectiveness of the UPP in it.
著者
三塩 武徳 藤田 桂英
出版者
一般社団法人情報処理学会
雑誌
研究報告ゲーム情報学(GI) (ISSN:09196072)
巻号頁・発行日
vol.2015, no.7, pp.1-6, 2015-02-26

本論文では二人不完全情報ゲームである 「ガイスター (geister)」 に独自の交渉ルールを追加した 「NEGOgeister」 を対象とする.本ゲームでの交渉を有利に進めるためには相手と自分の駒の価値を相対的に正しく評価し自分の得になる選択をする必要がある.一方,教師データとなるガイスターの棋譜は極めて少ないため駒の価値を評価する関数を作成することが難しい.そこで本手法では UPP 的な概念を用いて,シミュレーション結果の差異によって相手の駒の価値を推定する.これは正体のわからない相手の駒がゲーム中どれだけの価値があるのかを評価する特徴の一つとなる.さらに,評価実験によりこの特徴が相手の駒の価値を正確に反映しているかを確認した.In this paper, we study the "NEGOgeister" including our own negotiation rules to the "geister" which is a bilateral incomplete information game. A player needs to evaluate the values of our and opponent's pieces relatively, and select the effective strategies. However, it is difficult to decide functions of evaluating the values of the pieces because the records of "geister" which is used for learning data are little. Therefore, our proposed method estimates the values of the opponent's pieces with differences of simulation results using the UPP concept. It is the one of important features to evaluate the values of unknown opponent's pieces. We evaluate and discuss them with the objective of evaluating the values of opponent's pieces, accurately.