著者
井手 広康 奥田 隆史
雑誌
ゲームプログラミングワークショップ2017論文集
巻号頁・発行日
vol.2017, pp.171-176, 2017-11-03

全自動麻雀卓は“牌をかき混ぜて牌山に積み上げる動作”を自動で行う麻雀卓のことを指す.全自動麻雀卓の撹拌手法には一定の規則性があるため,これが要因となって牌に偏りが生じている可能性があると考えられる.そこで本研究では,マルチエージェント・シミュレーションを用いた全自動麻雀卓における撹拌手法のモデル化について提案し,牌の撹拌率について分析を行った.シミュレーションの結果から,全自動麻雀卓の撹拌手法によって少なからず牌に偏りが発生していることがわかった.また本シミュレーションによる撹拌手法のモデルでは,全自動麻雀卓のドラムに空回転を加えることによって撹拌率は改善され,3回転以上の空回転を加えたとき十分に牌全体が撹拌するという結果が得られた.
著者
築地 毅 柴原 一友
雑誌
ゲームプログラミングワークショップ2017論文集
巻号頁・発行日
vol.2017, pp.163-170, 2017-11-03

本稿では,麻雀の捨て牌を自動選択させるのに効果的なCNN構成を提案する.近年ディープラーニングの技術が確立し始めており,特に画像認識分野において,既存の技術では困難であった特徴の自動抽出をディープラーニングおよびCNNで実現したことにより,非常に高い精度を上げるようになってきている.麻雀においてもニューラルネットワークやディープラーニングを用いた事例は発表されている.一方,麻雀特有の情報を特徴量としてコーディングしており,特徴を自動抽出するというディープラーニングの特性を活かした設計になっているとは言いがたく,人の設計の手を離れることで,さらに精度が向上する可能性はあると考えられる.そこで本稿では,麻雀の特徴を自動抽出して捨て牌を自動選択する学習を行うことを目的として,位置不変性や共有重みの概念を活かした,麻雀の学習用CNN構成を提案する.本稿で提案する牌のコーディング方法およびフィルターを組み合わせたCNN構成により,手牌と捨て牌だけという極めて単純な入力データを用いて,テストデータとの一致率を53.98%にまで上げる事に成功した.
著者
末續 鴻輝
雑誌
ゲームプログラミングワークショップ2017論文集
巻号頁・発行日
vol.2017, pp.230-235, 2017-11-03

完全情報ゲームの多くの研究は2人プレイのものに限定され,3人以上でプレイするゲームに関する研究は,Li[1]や,Straffin[2],Propp[3]などの研究があるものの,その絶対数は少ない.その理由の一つには,3人以上のゲーム独自の問題がある.2人ゲームにおいては,ゲーム木をすべて書き下し,終了局面から再帰的に遡ることで,それぞれの局面において先手に必勝手順が存在するか,あるいは後手に必勝手順が存在するかどうかを判定することができる.しかしながら,3人以上のゲームにおいては,このように一意に勝者を定めることはできない.本研究では,Liが導入した順位の拡張とも言える概念を導入し,よく知られた完全情報ゲームNIMの多人数版の解析を行う.さらにこれが,正規形のゲーム (最後の着手をしたプレイヤーの勝ちとなるゲーム)だけでなく逆形のゲーム (最後の着手をしたプレイヤーが負けとなるゲーム)を含めた拡張となっていることを示す.
著者
伊藤 幹太 Reijer Grimbergen
雑誌
ゲームプログラミングワークショップ2017論文集
巻号頁・発行日
vol.2017, pp.183-188, 2017-11-03

囲碁のトップ棋士に人工知能が勝利し,完全情報ゲームにおける強い人工知能の研究はおおむね決着がついた.次の題材として不完全情報ゲームである人狼ゲームが注目されており,人狼知能の研究が行われている.人狼ゲームは一般的に有効とされる通説が存在するが,人間が用いる戦術を分析した研究はあまり行われていない.そこで本研究では人間同士で行われた人狼ゲームの対戦ログの分析を行い,2つの戦術を発見した.1つ目は自身に処刑の投票を誘導する戦術である.2つ目は村人騙りといった戦術である.また,既存の人狼知能ではこれらの戦術を用いていないことを示し,人狼知能に導入する際の方法について提案手法を述べた.その結果,自身に処刑の投票を誘導する戦術は既存の人狼と比較して勝率が5%増加することを示したが,村人騙り戦術は勝率が変化せず有効性を見出すに至らなかった.しかし,勝率が変化しなかったことから有効ではないと断言することはできないが,戦術についてより考察を行うことで有効的に使用できるのではないかと考えた.
著者
佐藤 直之 池田 心
雑誌
ゲームプログラミングワークショップ2017論文集
巻号頁・発行日
vol.2017, pp.64-71, 2017-11-03

花札の「こいこい」ゲームは交互2人零和不完全情報ゲームの一種で,様々な媒体で多くの人に遊ばれているが研究例が少なく,人間の上級者に匹敵する人工プレイヤが開発されたという話も聞かない.そのため我々は強化学習の方策勾配法とNeural Fitted Q Iterationを用いて強い「こいこい」プレイヤの実装を試みた.それぞれ盤面の低級な特徴量268個を入力に用いた人工ニューラルネットワークを状態行動価値の推定に用い,簡単なルールベース人工プレイヤとの反復対戦を通じて適切なパラメータの学習を行った.その結果それぞれ対戦相手から搾取した平均スコアは-0.3点と0.5点となった.
著者
大川 貴聖 吉仲 亮 篠原 歩
雑誌
ゲームプログラミングワークショップ2017論文集
巻号頁・発行日
vol.2017, pp.50-55, 2017-11-03

人狼ゲームで勝利するためには,各プレイヤの役職を推定することが重要である.先行研究では,サポートベクターマシンを用いて人狼を推定する手法が提案された.本論文では,先行研究を基に,深層学習を用いて役職を推定するエージェントを提案する.学習で使用する特徴を増やし,学習モデルをサポートベクターマシンから多層パーセプトロンに変更した.また,計算機実験において,過去の人狼知能大会のエージェントと対戦し,その勝率と推定精度に対する評価を行った.その結果,提案手法が有効であることを確認した.
著者
黄 柱皓 金子 知適
雑誌
ゲームプログラミングワークショップ2017論文集
巻号頁・発行日
vol.2017, pp.195-200, 2017-11-03

二人以上を対象としたゲームでは,参加するプレイヤーの勝ちやすさがある程度均衡していることが好ましい.これを(ゲーム)バランスが取れているという.囲碁や将棋では初期状態が毎回同じなのでバランスの問題はないが,多くのボードゲームは,マップと呼ばれる初期状態を毎回異なるものに設定して競うため,マップ次第ではバランスが崩れうる.本研究では,マップを用いたボードゲームの一例としてSettlers of Catanに着目し,特定のマップにおけるプレイヤー間のバランスを評価するための手法について検討し,過去のマップを評価した.また本研究では,Settlers of Catanにおいてバランスの取れた多様なマップ群の自動生成を提案した.
著者
嶽 俊太郎 金子 知適
雑誌
ゲームプログラミングワークショップ2017論文集
巻号頁・発行日
vol.2017, pp.250-257, 2017-11-03

ゲームAI分野において,自己対戦により強化学習を行って評価関数を作成する手法は,AlphaGoに代表されるように大きな成功を収めてきた. しかし,強化学習で学習した評価関数は,当然のことながら最適価値関数とは限らず,また最適価値関数からどの程度離れているかもわからない. この研究では、強化学習により学習した評価関数が、最適評価関数と比べてどの程度精度の面で離れているか一定の判断基準を与えることを目的とする. 実験は最適評価関数が解析されているどうぶつしょうぎを用いて行う. 完全解析データにノイズを加えて学習させた評価関数を強化学習による評価関数と見立て,これと最適評価関数との精度を比較をする. 実験から,評価関数のモデルの種類によっては40%のノイズを加えても精度があまり落ちず,想定していたよりもノイズに対して頑丈であることを示す結果が得られた. また,より高度なモデルの方がノイズの影響を受けやすいことを示唆する結果も得られた. この結果は,より高度で正確な評価関数を作成・学習させるには,学習データの精度もより正確でなければならないということ指し示していると考えることができる.
著者
高橋 一幸 Temsiririrkkul Sila 池田 心
雑誌
ゲームプログラミングワークショップ2017論文集
巻号頁・発行日
vol.2017, pp.19-25, 2017-11-03

日本では「不思議のダンジョン」シリーズで名高いローグライクゲームは,マップや敵配置がランダムなこと,そのため臨機応変にアイテム等を使い分ける必要があることなどを特徴とする一人用ダンジョン探索ゲームの総称である.囲碁や将棋などよりは複雑で,StarcraftやCivilizationなどよりは単純なこのゲーム群は,短期的戦術と長期的スケジューリングの両方を要するなど,高度なゲームAIを研究するうえでの良い課題をいくつも持つ.本論文では,学術用プラットフォームを共有できるようにするために,ローグライクゲームの最低限の要素を持たせたゲームのルールを提案した.そのうえで,ルールベースのコンピュータプレイヤ,短期的な戦術行動を改善するためのモンテカルロ法プレイヤ,長期的な視点での行動が取れるようにするための教師あり学習を提案した.
著者
渡辺 敬介 金子 知適
雑誌
ゲームプログラミングワークショップ2017論文集
巻号頁・発行日
vol.2017, pp.158-162, 2017-11-03

本論文は,将棋における勾配ブースティング木を用いた局面評価関数を実証する.現在,殆どの将棋プログラムでは線形モデルを用いた評価関数が使用されている.一方で,機械学習分野では様々な非線形モデルを用いた手法が提案されており,これらの手法をうまく将棋に適用できれば既存手法より正確な評価関数を作成できると期待される.本研究は,勾配ブースティングを用いることにより評価関数の改善を試みた.1手当たりの探索局面数を固定して対局実験を行った結果,提案手法は基本手法に対して勝率6割以上で勝ち越し,提案手法が有力な手法であることが示された.しかし探索速度では提案手法に従来手法に大きく劣り,さらなる改善が必要であると考えられる.
著者
中村 一行 松原 仁
雑誌
ゲームプログラミングワークショップ2017論文集
巻号頁・発行日
vol.2017, pp.126-130, 2017-11-03

近年, 囲碁における強さを追求する研究は多く行われてきた. しかし, 指導碁を目的とした, 教育プログラムに関する研究はあまり多くない. そこで本研究では, 囲碁初心者を対象とした指導方法の分析を行った. 記憶に残る学習方法を調査するため, 初心者を対象とした指導本を対象に, 指導方法及び順序についてのタグとして, 宣言的知識, 手続き的知識という2つに分けて分析を行った. 結果として, 専門用語は出来る限り既知の知識から説明する配慮が必要であること, 繰り返し説明を行うことが良いという分析結果を得た.
著者
伊藤 滉貴 阿原 一志
雑誌
ゲームプログラミングワークショップ2017論文集
巻号頁・発行日
vol.2017, pp.88-95, 2017-11-03

本研究は第一著者が考案したHICHAIN(以下本ゲーム)という二人完全情報ゲームの提案,実装と,そのAI開発に関する研究である.本ゲームはアルファベットのカードを使ったゲームで,サイズに制限のない2次元の盤にカードの向きを指定して着手することで実質的に3次元の盤を実現している.また1ターンあたり平均約1000手と多く,探索空間は10162になる.このような盤を構成するため「相対参照アルゴリズム」とルールの実装に必要なアルゴリズムを考案し,本ゲームのAIの実装に向けて探索アルゴリズムや評価方法を考察した.