著者
猪原 弘之 小山 聡 栗原 正仁
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.44-48, 2016-10-28

ゲームAIはコンピュータ黎明期から盛んに研究されており,コンピュータが扱いやすいものから順に研究していく意味で特に完全情報ゲームの研究が中心だった.しかし,チェス,将棋,囲碁などの主要な完全情報ゲームにおける研究は人間のトッププロよりも高い実力が発揮できるレベルまでに達し,単純に強いだけの完全情報ゲームのAIを作る研究は終焉を迎えつつある.そこで,本稿では数多くある不完全情報ゲームの中でも,盛んに研究されているポーカーや麻雀などにないゲーム特性を持ったポケモン対戦を対象として,そのゲームが持つ特徴を紹介し,それぞれ異なる工夫を施したいくつかのUCTアルゴリズムの有効性を検証した.その結果,ポケモン対戦でUCTの実力を一番引き出す方法が分かったが,モンテカルロ法とUCTの実力に有意差がなく,ポケモン対戦にはUCTアルゴリズムが有効とは言えない可能性があることが分かった.
著者
竹内 聖悟
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.21-27, 2016-10-28

人工知能(以下AI)の研究開発が広く行われ,医療への利用や自動運転など社会の中でも利用される場面が今後増えていくことが期待されている.一方で,人間の経験的知識やAIが見逃すエラーの存在などからも,人間とAIとが協調し,より効率的に処理を行うようなシステムが必要となる.ヒューマンエラーへの対処としてはAIによるチェックを,AI が見逃すエラーに対しては人間によるチェックなど問題に応じて適切なシステムを構築する必要がある.本研究では,人間とAI が協調して効率的な処理を行うシステムとして,人間がアドバイスを与え,それを受けてAIが効率的に処理を行うようなシステムの実現を目的とする.人工知能のテストベッドとして利用されてきたゲームを対象として,アドバイスによって効率的な処理を行うシステムを構築する.本稿では,将棋を対象として,アドバイスをゲームAI が有効活用するシステムを提案した.提案手法の有用性を示すために対戦実験を行った.アドバイスを与えるプレイヤを人間ではなくゲームAIを利用し,アドバイスを受けたゲームAI はそうでないゲームAI に対して有意に勝ち越し,目的であるアドバイスを活用するシステムの構築を確認できた.また,異種多数決合議との比較でも提案手法は有意に勝ち越し,提案手法の有用性を示すことができた.
著者
水上 直紀 鶴岡 慶雅
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.81-88, 2016-10-28

本論文では強化学習を用いた麻雀プレイヤを構築する方法について述べる.初めに手牌から和了点数を予測するモデルを生成した牌譜から学習する.このモデルの結果と期待最終順位を用いて効率的な和了を行う手をプログラムは選択する.このモデルの結果と期待最終順位を用いて効率的な和了を行う手をプログラムは選択する.得られたプログラムは高い点数を和了する技術を獲得したものの,自己対戦の結果は元のプログラムに勝ち越すことはできなかった.
著者
亀甲 博貴 森 信介 鶴岡 慶雅
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.28-35, 2016-10-28

本稿では将棋の解説文において示すべき指し手の推定手法を提案する.人間が付与した解説文中に現れる指し手符号と実際のゲームの状態空間との対応付けを行うことによって得られた,解説木という概念によって示された人間による解説文中に現れる指し手を教師として,解説すべき指し手の予測モデルを学習する.また,これによって得られた予測モデルと探索結果を組み合わせることで解説されるべき指し手の予測を行う.指し手の予測モデルは精度の大幅な向上は実現できなかったが,解説文中に現れる指し手は棋譜中の指し手とは異なる性質を持っており,提案手法によってその性質を獲得しうることを示した.またこの予測モデルと探索結果を組み合わせることで一部の解説木の生成が可能であることを示した.
著者
佐藤 直之 Sila Temsiririrkkul Luong Huu Phuc 池田 心
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.57-64, 2016-10-28

近年,人間らしい挙動をするゲーム人工プレイヤに関する技術が注目されている.古典的ボードゲームだけでなくリアルタイム制のビデオゲームでも研究例が多い.一方で,日本で人気があるゲームジャンルの1つであるシューティングはあまりその対象として注目されてこなかった.シューティングは概して人間による1人用ゲームだが,対戦型シューティングというジャンルがあり,そこではキャラクタの自然で人間らしい動作が求められる.我々はシューティングの既存組み込み人工プレイヤの観察によって,大域的な視野の不足や精密に過ぎる動作,細かな振動の動作は,人間らしくない印象を与える要因であると考えた.そこで我々は十分に遠い先を読む探索と,弾の将来の位置予測を反映したInfluenceMap の併用でキャラクタの大域的で精密すぎない動きの実現法を提案した.またキャラクタの動作を複数フレームにまたがり固定する事で細かな振動を抑制した.この実装と被験者実験により,この手法の有効性を確かめた.
著者
齋藤 雄太 鶴岡 慶雅
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.196-200, 2016-10-28

事前知識を用いない多人数不完全情報ゲームのAIの学習は、人工知能を現実世界の問題に応用する上で非常に重要な課題の一つである。本研究では、多人数不完全情報ゲームの一種であるトリックテイキングゲームの行動価値観数を線形関数で近似し、Q学習を行った。その結果、トリックテイキングゲームにQ学習を適用することで単純なルールベースのプレイヤに勝る結果が得られること、自己対戦による学習を行うことで、ランダムプレイヤによる学習を行った時よりも学習結果が向上することを示した。
著者
河村 圭悟 水上 直紀 鶴岡 慶雅
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.188-195, 2016-10-28

不完全情報ゲームにおいて,ナッシュ均衡戦略は非常に重要なテーマである.特に多人数不完全情報ゲームにおいては,ナッシュ均衡解を一般に求める方法はまだ確立されていないことから,多くの関心を集めている.2人テキサス・ホールデムはCFR+ (Tamelin, 2014) によって解かれた (generally weakly solved) が,CFR+は空間計算量の観点から3人以上のテキサス・ホールデムに適用するには問題がある.本研究ではNFSP (Heinrich and Silver, 2016) と呼ばれる手法を用いて,CFR+では解くことが難しい多人数不完全情報ゲームのナッシュ均衡解を求めることを目指す.本研究では,学習部分にソフトマックス回帰を用いたFictitious Self-Play (FSP) を使用して,テキサス・ホールデムのトイゲームである2人クン・ポーカーにおいてFSPが近似的なナッシュ均衡解を求められることを示した.また,多人数ゲームである3人クン・ポーカーにおいても,FSPが近似的なナッシュ均衡解を求められることを示し,CFR+の戦略に対するFSPの戦略の平均被搾取量が減少することを示した.
著者
大渡 勝己 田中 哲朗
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.180-187, 2016-10-28

本研究では連続空間のMDPに対するモンテカルロ木探索を基にした行動決定手法を提案する.提案手法を,カーリングの戦略を議論するために作成された「デジタルカーリング」システムにおける対戦プログラムに適用した.実験の結果,単純なシミュレーション方策を用いた場合だけでなく,カーリングの知識を用いた複雑なシミュレーション方策を用いた場合にも提案手法が有効に働くことを確認した.
著者
鎌田 徹朗 橋本 剛
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.167-171, 2016-10-28

StarCraftはRTS(Real-Time Strategy)ゲームの中でも特に人気のシリーズであり,多くのプロが存在している.現在までに,プロより強いAI開発を目標として様々な研究が行われているが,AIはプロに対して0勝15敗と惨敗しており,プロのレベルには遠い.本研究ではより効率的なAIの強化を考え,StarCraftの作戦に注目し,深層学習を用いた対戦相手の作戦予測手法を提案する.
著者
万 鵬 Reijer Grimbergen
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.162-166, 2016-10-28

戦略的な思考は経済分野,軍事分野などいろいろな分野で使用されている. 本研究では, RTSゲームのStarCraft2環境で戦略的な思考が出来る人工知能の実験をする.相手より戦略優位に行くことが出来れば, 戦略的な思考の人工知能を有効と判断する.
著者
佐藤 直之 Sila Temsiririrkkul Luong Huu Phuc 池田 心
出版者
情報処理学会
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.57-64, 2016-10-28

近年,人間らしい挙動をするゲーム人工プレイヤに関する技術が注目されている.古典的ボードゲームだけでなくリアルタイム制のビデオゲームでも研究例が多い.一方で,日本で人気があるゲームジャンルの1つであるシューティングはあまりその対象として注目されてこなかった.シューティングは概して人間による1人用ゲームだが,対戦型シューティングというジャンルがあり,そこではキャラクタの自然で人間らしい動作が求められる.我々はシューティングの既存組み込み人工プレイヤの観察によって,大域的な視野の不足や精密に過ぎる動作,細かな振動の動作は,人間らしくない印象を与える要因であると考えた.そこで我々は十分に遠い先を読む探索と,弾の将来の位置予測を反映したInfluenceMap の併用でキャラクタの大域的で精密すぎない動きの実現法を提案した.またキャラクタの動作を複数フレームにまたがり固定する事で細かな振動を抑制した.この実装と被験者実験により,この手法の有効性を確かめた.Recently, techniques for human-like artificial game player get to gather attention. Not only classical board games but also recent real-time video games are used as the target. However, shoot'em up video games are rarely used as the target of developing such techniques. We observed existing shoot'em up game artificial players and concluded that they are not human like because of their narrow eye sights, too precise avoidance moves, and moves like fine vibration. Therefore we addressed these problems with route search techniques that can look ahead possible routes enough further, and influence map technique that shows areas where bullets can pass in near future. Additionally, we forced character moves to last multiple frames to reduce vibrating moves. We implemented the methods and evaluated that our method contributes to make artificial players look human-like by a subject experiment with human subjects.
著者
Ching-Nung Lin Shi-Jim Yen
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.65-68, 2016-10-28

The performance of Deep Learning Inference is a serious issue when combining with speed delicate Monte Carlo Tree Search. Traditional hybrid CPU and Graphics processing unit solution is bounded because of frequently heavy data transferring. This paper proposes a method making Deep Convolution Neural Network prediction and MCTS execution simultaneously at Intel Xeon Phi. This outperforms all present solutions. With our methodology, high quality simulation with pure DCNN can be done in a reasonable time.
著者
平井 弘一 Reijer Grimbergen
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.158-161, 2016-10-28

近年,ユーザーが見ている重要な情報をアイコンが覆い隠さないように,焦点付近からずらして表示する研究が行われている.今後,アイコン位置を動的に決定することもあると思われる.このようにアイコン等の表示位置を自動的に調節する場合,人間の視覚特性を理解したAIが行うことが有用であると考え,AIに人間の視覚特性を付与する.本研究では人間の視覚特性のうち,周辺視と呼ばれる部分における特性の一つである正確な位置や形が認識できないという特徴を再現することとした.研究の第一歩として単純な環境であるゲームを用いる.ゲームのジャンルは視野全体を使う弾幕シューティングを選んだ.弾幕シューティングをプレイするAIに人間の周辺視の特徴の一つである,位置を正しく認識できない特性をつける.AIは「ゲーム情報の認識」,「移動すべき位置の割り出し」,「移動方向の決定」を繰り返す.この三つの行動のうち,ゲーム情報の認識に関して,正しく認識できない処理を施す.ゲーム情報を正しく認識できないAIとゲーム情報を正しく認識できるAIの動きを比べ,正しく認識できないAIが人間的な動きを行うようになっているか評価する.AIの試験環境として弾幕シューティングゲームを作成し,AIの性能を評価する.
著者
瀧澤 武信
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.100-107, 2016-10-28

「世界コンピュータ将棋選手権」(第10回までは「コンピュータ将棋選手権」)は1990年12月2日に第1回(1日制)が開催され,その後,時期を少しずつ後ろにずらしたため1995年には行われていないが,継続的にほぼ年に1回ずつ開催され,2016年5月3日~5日(3日制)には第26回が開催された.初期のころは上位入賞プログラムも弱いものであったが,2005年ころから急速に強くなり,今日に至っている.ここでは,初期のコンピュータ将棋選手権で活躍したプログラムの実力を検証し,今日への繋がりについて考察する.また,選手権に現れた長手数局について分析する.
著者
吉村 健志 宝珍 輝尚 野宮 浩揮
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.73-80, 2016-10-28

近年,将棋やオセロといった2人零和確定完全情報ゲームにおいて,トップ層の人間と同等の実力を持つプレイヤが実現されている.しかし,ポーカーや麻雀といった不確定不完全情報ゲームでは,そのようなプレイヤを実現することは難しい.本論文は4人零和不確定不完全情報ゲームである麻雀を取り上げる.そこで,本論文では,トップ層の人間に勝る麻雀プレイヤを実現するために,多人数不完全情報ゲームにおける最適行動の探索を検討する.ここでは,トップ層の人間の牌譜の知識を用いず,シミュレーションによって最適解の探索を行うタブーサーチを用いる手法を提案する.タブーサーチを適用するのは,打牌選択の局面と鳴きの局面である.提案手法を実現し,一致率実験とベンチマークプレイヤとの対局実験を行った.一致率実験によって,序盤の局面に対して,有効な和了形を最大$85\%$で見つけることができ,さらに,対局実験によって,提案手法がベンチマークプレイヤよりも優れているという結果が得られた.これらの結果から,タブーサーチによる最適解の探索が有効である可能性を示した.
著者
渡辺 順哉 金子 知適
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.141-148, 2016-10-28

近年,囲碁においてコンピュータプレイヤAlphaGoが世界トップ棋士の一人である李セドルに勝利した[11].囲碁を始めとする様々なゲームにおいてコンピュータプレイヤの強さはプロレベルに達し,個性に関する研究に期待が持たれている.本研究では,広く用いられている探索手法であるUCTの囲碁における個性の実現を目標とする.UCTでの個性の実現にはprior knowledgeとプレイアウト方策の調整が必要である.前者についてはどうぶつ将棋を題材とした先行研究がある[1].この先行研究ではprior knowledgeを用いることで指し手に特徴を持つプレイヤの実現に成功しているが,本来勝率が低いノードを高評価することでプレイヤが弱くなってしまう問題点がある.強さの調整には様々な手法が考えられるが,方策学習によって強さを調整し個性を実現する研究は行われていない.そこで,本研究ではUCTバランシング[2]という学習法とprior knowledgeを組み合わせ,探索全体でのバランスを調整し個性を実現することを提案する.また,強さの具体的な調整手法として,学習局面を調整することを提案する.実験結果から,prior knowledgeによって囲碁における打ち手に特徴が現れること,方策学習の局面数を調整することで強さが制御できることが確認された.また,提案手法で学習した方策を用いることで,対戦の段階でprior knowledgeを用いない場合においても着手が特徴を持つ傾向があることが分かった.
著者
野津 佑太 後藤 嵩幸 橋本 剛
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.123-128, 2016-10-28

コンピュータ将棋の評価関数は,Bonanzaメソッドの考案により機械学習で値を決めることが一般になり,格段にレベルが向上した.現在では,プロ棋士との対局で勝利するなど,トッププロの実力を追い越そうとしている.しかし,中盤以降に比べて序盤が弱いという弱点も抱えている.将棋プログラムの強さは評価関数の精度で決まる.40駒からなる将棋の盤面を評価する際,一般には局面を駒数個からなる部分局面に分割し,足し合わせて評価を行う.現在の多くのプログラムは,駒組み合わせ全てを保持する評価関数を用いているため,3駒程度の少ない駒数にしか分割できない.そのため,序盤で特に重要な盤面の細かな違いを認識することが出来ない.高次元組み合わせ評価を行うためには,重要な駒組み合わせのみを評価する評価関数が必要である.後藤は,重要な駒組み合わせのみを抽出する評価項目自動抽出法を提案し,高次元組み合わせ評価が可能となることを示唆した.しかし,学習や対局中の探索時間が大幅に増加し,まだ実用レベルには至っていない.そこで本研究では,評価項目自動抽出法の高速化手法を提案する.高速化手法を実装し,高速化前のプログラムと速度比較実験・対局実験を行い,性能向上を確認した.
著者
杵渕 哲彦 伊藤 毅志
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.119-122, 2016-10-28

自然な指し手を選択する将棋AI実現のために,人間が用いる思考方法である流れに着目する.遷移確率を流れを表現するものとし,指し手選択の際に,既存のAIが考慮している評価値に加え,遷移確率も考慮することで,自然な指し手の選択を行う,ランキング学習を用いた手法を提案する.評価実験として,最善でない選択が一定数含まれる中級者の棋譜と提案手法の指し手の一致率を測定し,既存手法に比べて一致率の向上が確認された.
著者
原 悠一 五十嵐 治一 森岡 祐一 山本 一将
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.108-111, 2016-10-28

ソフトマックス戦略に基づくシンプルな探索方式を提案し,コンピュータ将棋へ適用した実験結果を報告する.本探索方式では探索木中のノードの評価値は子ノードの評価値を選択確率で重み付けした期待値であり,再帰的に定義される.選択確率は選択先のノードの評価値を目的関数とするボルツマン分布を用いる.探索は実現確率を良さの度合いとする最良優先探索であり,深さの制御には実現確率の閾値を用いた反復深化を用いる.各ノードへの実現確率はルートノードからの選択確率の積で定義する.したがって,将棋の有効な指し手に関するヒューリスティクスは使用せず,最終的には局面評価関数だけに依存する.本発表ではこの探索方式の詳細と評価実験の結果を報告する.