著者
西谷 崇志 原 慎平 井上 真郷
出版者
一般社団法人情報処理学会
雑誌
研究報告ゲーム情報学(GI) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.27, pp.101-108, 2009-03-02

本研究ではダーツ01(301)ゲームを対象に研究を行った。ダーツゲームは状態遷移確率がプレイヤーのスキルに依存する不確定ゲームであるため、未だその戦略的側面についてはあまり詳しく研究されていない。本研究ではプレイヤーが狙った点からダーツが二次元正規分布に従って当たるとするモデルで解析を行った。また、01ゲームの状態遷移には様々な経路が存在する点に着目し、動的計画法を用いることでプレイヤーのスキルに応じて平均的に最も少ないラウンド数で終了条件を満たす戦略を得ることに成功した。また、対戦相手が前述の戦略をとるものと仮定した上での、勝率を最大化する戦略も求め、結果を得た。本手法はより一般的な501ゲームにも容易に適用可能である。We investigated the 301 darts game. The strategic aspects of this game have not been fully studied yet due to the complexity of its state transition equations depending on players' skills. In this research, we adopted a simple model of two-dimensional Gaussian distribution for the gap between targeted point and actual hit point. Then, we analyzed this game by using the dynamic programming techniques because it has numerous transition pathways. As the results, we successfully obtained the optimal strategy which minimizes the expected number of rounds needed to reach the goal. Besides, we also successfully obtained the optimal strategy which maximizes the probability of the winning assuming the opponent player adopting the above strategy. Our analysis method can be easily applied for more popular 501 darts game.
著者
阪本 真基 上野 敦志 田窪 朋仁
雑誌
研究報告ゲーム情報学(GI) (ISSN:21888736)
巻号頁・発行日
vol.2016-GI-35, no.12, pp.1-6, 2016-03-01

本論文では,自然言語によって対話を行うコミュニケーションゲーム 「人狼」 において,機械学習を用いてプレイヤの発言から役職の推定を行う手法を提案する.学習データはオンラインで提供される 「人狼 BBS」 のプレイログを用いた.プレイヤの発言を文書としてまとめ,word2vec を用いて単語の意味の類似性を考慮したベクトル表現を獲得する.獲得したベクトル表現を用いて,進行中のプレイヤの発言に基づいてプレイヤのベクトルを求め,k 近傍法,SVM により人狼の役職の推定を行い,交差検証により評価し考察した.
著者
浅田 麻菜 伊藤 毅志
雑誌
研究報告ゲーム情報学(GI)
巻号頁・発行日
vol.2011-GI-26, no.7, pp.1-7, 2011-06-24

駒の効き情報の視覚化が初心者の思考過程に与える影響について
著者
田中 哲朗
雑誌
研究報告ゲーム情報学(GI)
巻号頁・発行日
vol.2012-GI-27, no.12, pp.1-6, 2012-02-24

完全に解析を終わったゲームで完全プレイをおこなうためのデータベースは,完全ハッシュ関数とウェーブレット木を用いて,小さな記憶容量で実現できる.本研究では局面のノードを一段展開することで,更に記憶容量を減らす方法を提案する.これにより,「どうぶつしょうぎ」 の完全プレイのデータベースを 54.8MB の記憶容量で実現できた.これは,単純な実装と比較して 1/15 の容量となっている.
著者
齋藤 雅史 伊藤 毅志
雑誌
研究報告ゲーム情報学(GI) (ISSN:21888736)
巻号頁・発行日
vol.2023-GI-49, no.14, pp.1-6, 2023-03-10

人間を超えるレベルの将棋 AI が出現して,プロ棋士はそれを学習に利用するようになって久しい.将棋 AI がプロ棋士の棋譜に与えた影響について,将棋AIを用いてプロ棋士の定量的分析を行ってきた.その結果,将棋 AI との一致率が高くなることが判明した.一方,中盤以降の拮抗した局面における平均損失は変化がないことが確認された.本研究では,同様の分析をレーティング上位の 9 名(トッププロ棋士)について行い,全体のプロ棋士の結果と比較した.その結果,プロ棋士全体の順位戦の棋譜の結果に比べて,トッププロ棋士の定量的データが有意に高いことが示された.
著者
齋藤 雅史 伊藤 毅志
雑誌
研究報告ゲーム情報学(GI) (ISSN:21888736)
巻号頁・発行日
vol.2021-GI-46, no.3, pp.1-6, 2021-06-12

近年,将棋 AI はプロ棋士をはるかに凌駕するレベルにある.その結果,多くのプロ棋士が将棋 AI を自身の研究に取り入れるようになってきている.AI が賢くなるにつれて,我々人間は AI の影響を受け,その思考にも変化が生じている可能性がある.一方で近年の賢い AI が人間の思考に与える影響に関する研究はまだ少ない.将棋 AI は 2015 年頃に人間のトップを超えたと言われ,特に勝負の世界で生きているプロ棋士はその影響を強く受けていることが予想される.そこで,本研究では,人智を超えた将棋 AI の登場がプロ棋士に与えている影響について調査する.具体的には,プロ棋士の棋譜に注目し,将棋 AI を用いて AI との着手一致率や評価値の推移などを調べ,どのような変化が現れているのかを定量的なデータをもとに考察していく.
著者
山名 琢翔
雑誌
研究報告ゲーム情報学(GI) (ISSN:21888736)
巻号頁・発行日
vol.2022-GI-48, no.5, pp.1-5, 2022-06-25

オセロAI(オセロに自動で着手するプログラム)を制作し,計算資源の制約が厳しい世界的なオセロ AI コンテストで世界 1 位になった.コンテストの厳しいコードの文字数制限に対応するため,深層学習を用いた評価パラメータの圧縮を行った.さらに,手法を改善してコンテスト外の一般的なパソコンでも,現時点で世界最強と呼ばれるオセロ AI Edax 4.4 に勝利できるオセロ AI を制作した.本稿では深層学習による評価関数の圧縮に着目し,これら 2 つのオセロ AI における工夫を論じる.
著者
牧田 光平 池田 心
雑誌
研究報告ゲーム情報学(GI) (ISSN:21888736)
巻号頁・発行日
vol.2019-GI-41, no.21, pp.1-8, 2019-03-01

ぷよぷよは対戦型落ち物パズルゲームの一つであり,「連鎖」を効率よく構成することが重要な課題であるとともに楽しみにもなっている.初心者初級者が連鎖構成力を鍛える際,実戦だけではあまり効率が良くないため,“2手で3連鎖せよ”といった「なぞぷよ」問題が用いられることがある.高橋らの先行研究ではなぞぷよを自動生成しその面白さや難しさを教師あり学習で推定する試みが行われているが,本研究ではこれをさらに進め,2~4色,多数ぷよ~少数ぷよ,簡単~難しいなど多様なものを提供する方法を提案する.さらには,何を面白いと思うかはプレイヤごと,またはプレイヤの強さごとに異なることなどを踏まえ,個人や強さグループごとの教師あり学習を行って違いを見るなど,よりきめ細かいなぞぷよ提供システムの構築を試みる.
著者
芝 世弐
雑誌
研究報告ゲーム情報学(GI) (ISSN:21888736)
巻号頁・発行日
vol.2021-GI-46, no.2, pp.1-3, 2021-06-12

2020 年 11 月に行われた世界将棋 AI 電竜戦において深層学習とモンテカルロ木探索を組み合わせた所謂 PV-MCTS 系のプログラムが優勝し,将棋の探索エンジンとしては同系のものが今後主流となると思われていた.しかしながら,2021 年 5 月に行われた第 31 回世界コンピュータ将棋選手権においては決勝 8 チーム中 1 チームのみが同系エンジンであった.本研究はこの事象を持ち時間の観点から説明を試みる前段階として探索アルゴリズムの時間利用の適性を評価しようとするものである.
著者
門 裕太 大久保 誠也 若月 光夫 西野 哲朗
雑誌
研究報告ゲーム情報学(GI) (ISSN:21888736)
巻号頁・発行日
vol.2019-GI-41, no.12, pp.1-6, 2019-03-01

コンピュータ大貧民の研究がUEC標準ルールに基づいて行われている.しかし,ローカルルールの効果に関する研究は,ほとんど行われていない.本研究では,ローカルルールが各種指標にどのような影響を与えるかについて検討を行った.特に,平均終了手数や平均合法手数といった指標について検討した.また,UEC標準ルールに基づいた大貧民は,戦略的複雑さが,他の現代のゲームと比べて非常に単純であることが示されている.そこで,ローカルルールによって複雑にすることができるかについて検討した.さらに,大貧民は,交換ルールによる順位の格差が大きいことや,席順によって得点に差があることも知られている.そこで,各種ローカルルールが席順と得点に与える影響について調査した.具体的には,代表的な大貧民プログラムを11バックや5飛び,6リバースに対応させ,それらを用いた計算機実験によりデータを収集し,その分析を行った.その結果,11バックは,階級の格差を改善するが,平均合法手数や戦略的複雑さは変化させないこと.また,5飛びや6リバースは,席順に応じた得点の差に影響を与えることがわかった.
著者
坂元 香菜美 篠田 正人
出版者
情報処理学会
雑誌
研究報告ゲーム情報学(GI) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.7, pp.1-8, 2010-06-18

神経衰弱とよばれるカードゲームに,ある特別なカードを取ったほうが勝ちというルールを導入する.2 人のプレーヤーがこのゲームをするときの勝率を最大化する戦略について考察し,両者が最善を尽くしたときこのゲームが後攻有利であることを述べる.We consider a modified version of The Memory Game, where we define that the winner of the game is the player possessing the pair of special cards. We study the optimal strategies which maximize the winning probability in the case of 2-player game, and we show that the player to flip second has an advantage over the opponent.
著者
五十嵐 治一 森岡 祐一 山本 一将
雑誌
研究報告ゲーム情報学(GI)
巻号頁・発行日
vol.2013-GI-30, no.6, pp.1-8, 2013-06-21

本論文では強化学習の一手法である方策勾配法をコンピュータ将棋に適用する方法を考察した.方策勾配法は,報酬や方策にマルコフ性の制限なく自由に設計することができるという大きなメリットがある.本論文では,最初に全 leaf 局面の局面評価値をその局面への遷移確率値で重み付けた期待値を用いた指し手評価方式を提案する.これをベースに,探索木の各ノードにおける指し手の選択法として Boltzmann 分布に基づくソフトマックス戦略を採用した場合の局面評価関数に含まれるパラメータの学習則を導出した.しかし,探索や学習時の計算量が膨大となるため,3 つの近似計算法を考案した.次に,探索時にシミュレーション方策を用いてモンテカルロ探索を行う場合や,探索の深さを制御する場合のために,局面評価関数とシミュレーション方策の両者を同時に学習する学習則を方策勾配法により導出した.さらに,この方策勾配の計算法を利用すると,局面ごとに正解手が既知の場合の教師付学習も可能であることを示し,実際に学習則を導出した.
著者
小松 智希 成澤 和志 篠原 歩
雑誌
研究報告ゲーム情報学(GI)
巻号頁・発行日
vol.2012-GI-28, no.8, pp.1-8, 2012-07-06

探索空間が非常に広く,評価関数が作りにくいゲームにおいて行動決定を行う手法にモンテカルロ法があり,囲碁や大貧民などのゲームに対して有効な手法であることがわかってきた.しかし,麻雀のように探索空間全体に対して得点が得られる組み合わせが少ないゲームでは,モンテカルロ法は報酬を得ることができるプレイアウトの回数が少ないため,十分な効果を発揮することができない.本論文では,麻雀におけるモンテカルロ法の非効率性を実験的に検証する.また,プレイアウトにおいて効率的に報酬を得ることができる手法を提案し,モンテカルロ法と比較することで実験的に有効性を示す.
著者
大渡 勝己 西野 順二
雑誌
研究報告ゲーム情報学(GI) (ISSN:21888736)
巻号頁・発行日
vol.2019-GI-41, no.24, pp.1-8, 2019-03-01

レーティングシステムはスポーツやゲームにおいてプレイヤの強さを推定し順位付けを行うことに役立っている.一般に広く用いられているイロレーティングはプレイヤの強さに全順序性を仮定しており,じゃんけんのように強さの関係が循環する場合を表現できない.近年,このような相性関係も含んだレーティングシステムの研究も行われており,本稿では相性を含んだレーティングモデルとして有用性が期待できるものを複数提案する.特に,三つ巴関係を直接表現するモデルを現実世界のデータに対して適用し,この提案モデルが現実のデータの推定精度を向上させうる可能性を示した.
著者
牧野 貴斗 濱川 礼
雑誌
研究報告ゲーム情報学(GI) (ISSN:21888736)
巻号頁・発行日
vol.2021-GI-46, no.7, pp.1-6, 2021-06-12

本研究では CGDL (A Card Game Description Language) を用いてトリックテイキングゲームのルールを記述し深層生成を行いトリックテイキングゲームを自動生成する手法を提案する.トリックテイキングゲームとは,ナポレオンやコントラクトブリッジに代表される全員でカードを決められた枚数出し.出したカードの大小などで勝敗を決めるトリックを複数回繰り返すゲームのことである.人の顔を見ながらできるカードゲームは,コミュニケーション能力を養い,ゲームに勝つために考える過程で思考力を養うことができる知育能力があると考えられている.ただ同一のゲームを繰り返しているとセオリーが確立し思考機会の減少,遊び慣れからゲームに飽きてしまい,カードゲームの持つ知育能力が損なわれてしまう.そこで,常に新しいゲームを提供することができればこの問題を解決できると考え,カードゲームの自動生成を行った.ゲームの自動生成分野では遺伝的アルゴリズムを用いてチェッカーや Go などのバランスの取れたボードゲームを設計する試みなどがあるがこれらの研究では限られたバリエーションでしかルールを表現できていない.そこで本研究では CGDL を用いてトリックテイキングゲームのルールを記述することで様々な形式に対応させ,これを深層学習で学習させることで,ルールをより多彩に表現することを試み,生成したゲームの評価を行った.
著者
都 勇志 木谷 裕紀 小野 廣隆
雑誌
研究報告ゲーム情報学(GI) (ISSN:21888736)
巻号頁・発行日
vol.2022-GI-47, no.14, pp.1-7, 2022-03-11

ゲームの難易比較や AI ベンチマークの妥当性評価などのため,二人零和有限確定完全情報ゲームの「複雑さ」の計量が様々な形で研究されている.代表的な「複雑さ」の尺度の一つが状態空間数であり,これは初期局面から到達可能な局面数として定義されている.本研究では将棋の状態空間数の見積もりを行う.禁則ルールの多さなどから将棋の厳密な状態空間数を測ることは容易ではないが,2008 年の篠田の研究により 4.65×1062 と 9.14×1069 の間の値を取ることがわかっている.本研究では将棋の状態空間数のより正確な評価を行い,2.45×1064 と 6.78×1069 の間の値を取ることを示す.上界値の評価については持ち駒が少ないほど局面のパターンが増えることに注目した計量方法を提案する.下界については,篠田により提案された駒配置のテンプレートを改良し,これに基づく解析を行う.また将棋から派生したゲームである 5 五将棋についても状態空間数が 13 桁から 20 桁の間であることを示す.
著者
田中悠 池田心
雑誌
研究報告ゲーム情報学(GI)
巻号頁・発行日
vol.2014-GI-31, no.10, pp.1-8, 2014-03-10

本研究では麻雀を対象として,局面の情報から取るべき “手” ではなく取るべき “戦略” を出力する決定木の作成を行った.まず麻雀において重要な戦略である 「早く上がる」 「高得点狙い」 「振り込み回避」 といった評価基準を元に行動を評価する 3 つのモデルを作成,これらを用いて上級者のゲームの記録 (牌譜) を上級者が意図したと思われる戦略別に分類した.上級者が意図したと思われる戦略を付与した牌譜を教師として局面の情報から取るべき戦略を出力する決定木の学習を行ったところ,決定木が元の戦略に正しく分類できた割合は約 31%,決定木が導出した戦略を元にモデルを組み合わせた手の評価において上級者の手が 3 位以内であった確率は約 86 %であった.
著者
大渡 勝己 木谷 裕紀
雑誌
研究報告ゲーム情報学(GI) (ISSN:21888736)
巻号頁・発行日
vol.2021-GI-46, no.15, pp.1-7, 2021-06-12

二人単貧民はトランプゲーム大富豪を簡略化した二人零和完全情報ゲームであり,この勝者は両プレイヤの手札枚数に対して線形時間で決定できる.本研究では,二人単貧民において,勝者の最後の提出札に着目し,この札の上に相手が札を提出可能か,またはパスしかできないかを考慮して試合結果を細かく分ける.このとき,互いのプレイヤの最強札の強さが異なる条件下においては,この試合結果についても手札枚数に対して線形時間で求められることを示す.さらに,最強札が同じ強さの場合についても,計算機実験の結果から予想しているゲームの性質について議論する.
著者
大森 瑛智 井上 真郷
雑誌
研究報告ゲーム情報学(GI)
巻号頁・発行日
vol.2012, no.5, pp.1-6, 2012-07-06

Minesweeper は一人用のパズルゲームであり,プレイヤーが全ての情報を得られる訳ではないという,不完全情報ゲームである.つまり,地雷が設置されていないと分かる安全なマスが常に存在する訳ではなく,勝利できるか否かは運によるところが大きい.ルールが単純であり,多くの人に親しまれている一方,最適戦略,および達成可能な勝率の上限は未だに分かっていない.これは,地雷の有無を判断するのに,難しい場面では,地雷が設置されていたとして矛盾しない全パターンを列挙する必要がある,つまり NP 完全問題となっていることに由来する.我々は本研究で, 1) 二体探索法により,問題が簡単な場合に高速に安全なマスを発見する方法, 2) 地雷設置可能な全パターンを効率よく列挙し,地雷設置確率を算出する方法, および3) 安全なマスがなく,地雷設置確率が最小のマスが複数ある場合の選択方法,の三つを組み合わせた手法を開発したので提案する.本手法は,16×30 マス,地雷 99 個の標準ゲームで勝率 49.4% を達成できた.Minesweeper is a puzzle game of incomplete information for one person. In this game, mine-free squares are sometimes unknowable from open information, thus, winning is not always guaranteed. The rule of the game is quite simple and many people are familiar with this game. On the other hand, the optimal strategy and the upper limit of the winning rate are not known so far. This is because this game needs the complete enumeration of all possible mine-filled square patterns in some difficult situations, which implies this game is NP-complete and so, indeed, it is. In this research, we developed a novel solver combining following three methods; 1) two-body search method which can find mine-free square quickly in easy situations, 2) the method which can calculate the mine-filled probability efficiently by the complete enumeration, and 3) the selecting method among two or more mine-filled squares having the same smallest mine-filled probability. This solver achieved the winning rate of 49.4% for the standard minefield of 16×30 squares containing 99 mines.
著者
Panumate Chetprayoon Iida Hiroyuki
出版者
情報処理学会
雑誌
研究報告ゲーム情報学(GI) (ISSN:21888736)
巻号頁・発行日
vol.2016-GI-36, no.6, pp.1-7, 2016-07-29

This paper explores an innovative way to find a comfortable setting of video games. Pokemon is chosen as a benchmark and game refinement theory is employed for the assessment. Pokemon has many entertaining factors to be considered like other video games. Interestingly, there are some factors which are still remained after the first episode of Pokemon was released in 1996. Among them, the number of Pokemon that one trainer can carry (n=6) has never been changed. It is assumed that the setting may be optimal, which has been realized by players as well as composers. In this paper, Pokemon battle game is simulated by simplifying many factors and different types of computer players (AIs) are developed for the experiments. The experimental results show that the setting (n=6) is the best in the sense that the setting covers most players of various levels and that Pokemon is mostly played by children. Moreover, there are other reasonable settings for some specific levels. For example, n=5 and n=7 may be a comfortable setting for experts and beginners, respectively.