著者
水上 直紀 鶴岡 慶雅
雑誌
ゲームプログラミングワークショップ2015論文集
巻号頁・発行日
vol.2015, pp.179-186, 2015-10-30

長期的な戦略に基づく手の決定は繰り返しゲームにおいて重要である.本論文では麻雀の繰り返しゲームの性質に着目して最終順位を考慮したコンピュータ麻雀プレイヤの構築法について述べる.牌譜中に現れた点数状況から最終順位を予測するモデルの学習を行う.モンテカルロ法のシミュレーションでの報酬を予測モデルの結果を用いることで最終順位に基づく手をプログラムは選択する.オンライン麻雀サイト「天鳳」で作成されたプログラムの実力を評価した結果,レーティングとして,中級者を超える1844点が得られた.
著者
畢 暁恒 田中 哲朗
雑誌
ゲームプログラミングワークショップ2015論文集
巻号頁・発行日
vol.2015, pp.25-30, 2015-10-30

これまでの人狼ゲームの戦略に関する研究の多くは村人と人狼しかいない場合を扱ってきた.占い師のいる先行研究もあったが,占い師が吊られた時に人狼でないことが分かるという異なるルールが適用されていた.本研究では,本来のルールの元で占い師と狩人を導入した上で,双方に制約を加え,最適の戦略を計算することを試みた.双方の最適な戦略は純粋戦略ではなく,混合戦略となるため,ϵ-ナッシュ均衡を計算するのにCFR+アルゴリズムを用いる.この結果,ゲームに関していくつかの考察を得た.
著者
大森 翔太朗 金子 知適
雑誌
ゲームプログラミングワークショップ2015論文集
巻号頁・発行日
vol.2015, pp.32-39, 2015-10-30

近年プレイヤの個性に関する研究が人工知能の分野で取り組まれ始めている. 本研究では, 将棋の指し手の選択に注目し, コンピュータプログラムで棋風を実現する方法について提案する. 棋風としては, プレイヤが攻めや受けなど特徴を持つ指し手を選ぶ傾向についてに着目する. 棋風を統計的に分析した過去の研究を参考に攻めの特徴と受けの特徴を決め, 攻めと受けの棋風について, それぞれの特徴の現れているプレイヤの棋譜を選別する. そしてそれらの棋譜を教師に評価関数の機械学習を行う. 攻めの棋譜と受けの棋譜と分類して, 今回学習に使用する棋譜のパラメータへの影響を盤面図に色の濃度で表し, 攻めの棋譜と受けの棋譜で学習の際に影響が大きそうなところを確認した. また提案手法で学習したプログラムと学習前のプログラムで対戦実験を行い, 学習がうまくできているかどうかを確認した. さらに学習に使用した攻めの棋譜と受けの棋譜の一致率を攻めの棋譜を学習させたプログラムと受けの棋譜を学習させたプログラムで測り, それぞれのプログラムに違いを確かめた. 棋風の検証では, 受けに関する次の一手問題を題材に学習前のプログラムと比べてどういった違いがあったのかを確認した.
著者
神田 直樹 伊藤 毅志
雑誌
ゲームプログラミングワークショップ2015論文集
巻号頁・発行日
vol.2015, pp.20-24, 2015-10-30

人間同士で行う人狼ゲームでは、一種の“通説”と呼ばれるプレイ戦略の指針のようなものによってプレイが行われることがある。しかし、人狼というゲーム自体歴史が浅く、これらの通説には疑わしいものも含まれている。本研究では、人狼知能プロジェクトが提唱する「標準ルール」において、基本的な役職行動と投票行動を行う“基準プレイ”を提案した。そして、人狼知能プロジェクトが提供している人狼サーバの自動対戦機能を用いて、基準プレイにおける勝率と通説を用いた場合の勝率を比較することで、通説の妥当性の検証を試みた。
著者
小川 直希 石脇 滉己 荒川 達也
雑誌
ゲームプログラミングワークショップ2015論文集
巻号頁・発行日
vol.2015, pp.40-45, 2015-10-30

本研究では, 将棋大盤解説における聞き手エージェントの開発に向けて, 聞き手から解説者への質問文の生成を目標とする. 大盤解説 の聞き手の主要な役割は, 盤面や解説に対して観客が感じる疑問をくみ取って, 解説者へ質問することである. 本研究ではそのために, 初心 者の着手を予想するための評価関数である「ナイーブ評価値」を用いる方法を提案する. 提案手法の有効性を検討するため, 特に詰将棋の大 盤解説を想定し, 正解詰め手順に対する質問文を生成するシステムを試作した. 実行結果を将棋経験者に見ていただいたところ, 概ね肯定的 な意見が寄せられた.
著者
築地 毅 柴原 一友
雑誌
ゲームプログラミングワークショップ2015論文集
巻号頁・発行日
vol.2015, pp.136-142, 2015-10-30

本稿ではディープラーニングの技術を用いて麻雀の評価関数を学習することを試みる.近年ディープラーニングの技術が確立し始めており,画像認識,音声認識,自然言語処理などの分野で優れた成果を上げている.ゲームの分野でも, ディープラーニングと強化学習を組み合わせたDeep Q Network により,多種多様なゲームの学習に成功しているが,筆者の知る限り,不完全情報ゲームへの適用は行われていない.そこで本稿では,不完全情報ゲームである麻雀の評価関数をディープラーニングの各種技術を利用して獲得し,有効性を評価する初の試みに取り組む.純粋な多層ニューラルネットとして学習した場合,ニューロンの数や層の深さを大きくしてネットワークの表現力を高めることで,学習データとの一致率は最大75.1%まで上がったが,テストデータとの一致率との大きな乖離が見られ,ディープラーニングの技術を用いることなく適切な学習をすることは難しいということが分かった.ディープラーニングの技術の一つであるオートエンコーダの採用有無により,収束状況や評価関数の精度に違いが見受けられたものの,汎化性能が高まるという結果は得られなかった.また,ディープラーニングの技術の一つであるドロップアウトにより,学習の過学習を抑え,テストデータとの一致率を37.2%から43.7%へ高めることに成功した.
著者
海津 純平 成澤 和志 篠原 歩
雑誌
ゲームプログラミングワークショップ2015論文集
巻号頁・発行日
vol.2015, pp.172-178, 2015-10-30

多人数不完全情報ゲームの一つである麻雀は,他プレイヤとの状況に応じて戦略を変更することが重要である.例えば,自分が大きく点差をつけられ順位が低いときは得点の高い役を狙う戦略が,自分がトップのときはゲームを早く終了させるための戦略が有効な戦略とされる.本論文では,プレイヤの戦略として捨てる牌の選択だけに着目するため,他プレイヤを排除した一人麻雀を考え,一人麻雀に対して一つのパラメータを変更することで打ち方を変えることができる手法を提案する.提案する手法は,小松らが提案したモンテカルロ法を改良した手法を基にしており,プレイアウトにおける報酬として,上がり点を高くするための評価指標と早上がりをするための評価指標の二つを組合せたものを用いている.また,計算機実験によって,計算時間および,上がり率,平均点数,上がった時の平均点数,平均上がり巡目に対する評価を行う.
著者
石飛 太一 飯田 弘之
雑誌
ゲームプログラミングワークショップ2015論文集
巻号頁・発行日
vol.2015, pp.126-131, 2015-10-30

探索中に得られた情報を探索以外の目的に利用することはときに有効であると考えられる.本研究では,証明数探索で求められた証明数・反証数および探索ノード数を詰め将棋コンクールにおける順位と比較し,これらの探索指標をパズル問題の感性評価のために用いる.これらの探索指標はパズル問題において難易度を表すことを確認し,コンクールの順位付けと難易度には密接な関係があることがわかった.
著者
ディプタラマ 石黒 裕也 成澤 和志 篠原 歩 ジョーダン チャールズ
雑誌
ゲームプログラミングワークショップ2015論文集
巻号頁・発行日
vol.2015, pp.154-161, 2015-10-30

一般化三並べはFrank Hararyによって提案された2人完全情報ゲームであり,碁盤面上に先手後手が交互に石を1つずつ置き,あらかじめ定められた動物を先に作ったプレイヤが勝ちというゲームである.2人完全情報ゲームの勝敗判定問題は与えられたゲームに対して,先手必勝,後手必勝または引き分けとなるかを判定する問題である.オセロや五目並べなど,多くの2 人完全情報ゲームの勝敗判定問題はPSPACE完全であることが知られている.それに対して,代表的なPSPACE 完全問題としてQuantified Boolean Formula (QBF) に対する充足可能性問題(TQBF)が存在し,TQBFを高速に解くプログラム,QBFソルバが開発されてきた.本研究では一般化三並べの拡張であるGTTT(p,q)およびTorusGTTT(m,n)の勝敗判定問題をTQBFに帰着し,QBFソルバを用いてゲーム勝敗判定問題を解く.ゲームのパラメータによっては既存のゲームの探索手法より,QBFソルバの方がより速く勝敗判定問題を解けることが見られた.