著者
及川 大志 池田 心
雑誌
ゲームプログラミングワークショップ2018論文集
巻号頁・発行日
vol.2018, pp.175-182, 2018-11-09

近年ゲームAIの研究は対戦相手として強いAIのみならず,ゲームそのものを楽しくするために様々な役割を担うようになってきている.テトリスは落下型パズルゲームとして長年数多くのプレイヤから愛されているゲームであるが,近年,T-spinと呼ばれている技術の登場により戦略の幅が大きく広がった.一方でこの技術は初心者にとって難解であり,また練習するための環境が十分整っていない.そこで本研究ではこのT-spinを学ぶ上で補助となる「詰めテトリス問題」を自動で生成する手法,さらにその面白さと難しさを教師あり学習で推定する手法を提案した.現時点では1手詰めのみを扱っているが,その面白さ・難しさを5段階評価の0.4ポイント程度の誤差で推測することに成功した.
著者
芝 世弐
雑誌
ゲームプログラミングワークショップ2018論文集
巻号頁・発行日
vol.2018, pp.60-63, 2018-11-09

本研究はコンピュータ将棋における序盤定跡の自動生成を行おうとするものである.具体的な実装を行いその効果のほどを確認した後,公的な大会である電王トーナメント及び世界コンピュータ将棋選手権において有効性を示した.
著者
中屋敷 太一 金子 知適
雑誌
ゲームプログラミングワークショップ2018論文集
巻号頁・発行日
vol.2018, pp.1-8, 2018-11-09

近年コンピュータ将棋プログラムは対局で人間のプロ棋士に勝利し,棋力は人間のプロ棋士を超えたと言われている.一方で,将棋プログラムによる将棋の局面の解説は,局面の勝率予測や次の指し手の予想ではある程度成功しているものの,それが何を根拠に決定されたかという内容を説明する手法はまだ確立されていない.もし将棋プログラムの判断の根拠を,プログラムが自動で,プログラムの利用者に説明することができれば,人間の棋力向上のサポートなどに用いることができ有用である.本稿では,画像分類を行うニューラルネットワークに対して考案された顕著性抽出手法を,将棋プログラムに用いられているニューラルネットワークに適用した.また,顕著性抽出手法は元の画像のどの部分に注目して判断したのかを可視化する技術であるが,可視化する際にいくつかの手法が考えられるため,本稿ではそれらの手法の差異を検討した.
著者
及川 大志 池田 心
出版者
情報処理学会
雑誌
ゲームプログラミングワークショップ2018論文集
巻号頁・発行日
no.2018, pp.175-182, 2018-11-09

近年ゲームAIの研究は対戦相手として強いAIのみならず,ゲームそのものを楽しくするために様々な役割を担うようになってきている.テトリスは落下型パズルゲームとして長年数多くのプレイヤから愛されているゲームであるが,近年,T-spinと呼ばれている技術の登場により戦略の幅が大きく広がった.一方でこの技術は初心者にとって難解であり,また練習するための環境が十分整っていない.そこで本研究ではこのT-spinを学ぶ上で補助となる「詰めテトリス問題」を自動で生成する手法,さらにその面白さと難しさを教師あり学習で推定する手法を提案した.現時点では1手詰めのみを扱っているが,その面白さ・難しさを5段階評価の0.4ポイント程度の誤差で推測することに成功した.
著者
木谷 裕紀 小野 廣隆
雑誌
ゲームプログラミングワークショップ2018論文集
巻号頁・発行日
vol.2018, pp.199-203, 2018-11-09

全国的に認知度, 人気が高いトランプカードゲームの一つであるババ抜きは不完全情報ゲームであり, 心理的な駆け引きを除けば戦略性よりも偶然性が支配するゲームである. 本研究では手札公開で行う完全情報の「ババ抜き」ゲームを定義し, その最適戦略について考察する. プレイヤーが3 人の場合における必勝戦略の有無に関する必要十分条件を与える. さらに, プレイヤー4 人以上のときすべてのプレイヤーが最善をつくすと「千日手」が発生して引き分けとなる局面が存在することを示す.
著者
杉本 直樹 鶴岡 慶雅
雑誌
ゲームプログラミングワークショップ2018論文集
巻号頁・発行日
vol.2018, pp.114-119, 2018-11-09

実用上の人間の対戦相手としてのゲームAI には、強すぎず弱すぎない人間のプレイヤーと互角の実力が求められる。本研究では、プレイヤーの戦略を動的に推定しそれに応じて対戦AI を変化させ、2人対戦ゲームにおいてゲーム固有の知識を利用することなくAI プレイヤーの実力を人間のプレイヤーと互角となるよう調整し、なおかつそのAI プレイヤーが不自然な振る舞いを見せないようにする事を目的とする。本稿では、研究のため作成したパズルシミュレーションゲームにおいて提案手法によるAI がランダムAI よりも長く試合を続けられる事を示した。
著者
濱野 航汰 松原 仁
雑誌
ゲームプログラミングワークショップ2018論文集
巻号頁・発行日
vol.2018, pp.95-100, 2018-11-09

ゲームAI が誰よりも強くなることを目的とした研究は多くあるが,それを一般のプレイヤーのために活用するのは難しい.また,プレイヤーが対戦を楽しむためには,その対戦相手の実力が同じくらいであることが重要である.そこで本研究ではオセロを題材とし,同程度の実力を持ったプレイヤーのマッチングや実力の差に応じた適切なハンディキャップの掛け方に貢献することを目的に,オセロプレイヤーのレーティングを推定する式を棋譜を解析することによって定義した.そして,10 人のプレイヤーの棋譜からレーティングを推定し,実際のレーティングと比較することで,この手法の正しさを検証した.その結果,適切にレーティングを推定することはできなかった.今後はレーティングを推定する式の定義方法の改良が課題である.
著者
藤村 悠太朗 金子 知適
雑誌
ゲームプログラミングワークショップ2018論文集
巻号頁・発行日
vol.2018, pp.145-152, 2018-11-09

近年,環境から得た報酬を用いて学習を行う,強化学習の手法が盛んに研究されている.Deep Q-Network がAtari2600の様々なゲームで人間のプレイヤーを上回るスコアを達成したことが報告されており,より一般的なビデオゲームへの応用も期待されている.本研究は,世界的に有名なコンピュータゲームであるMinecraft上で動作するAIエージェントを研究対象とする.Minecraft のようなゲームは環境から報酬が与えられる機会が少なく,そのままでは学習が難しいという問題がある.この問題を解決するため,課題を階層的に分割することで模倣学習と強化学習を組み合わせる手法であるhg-DAgger/Qで学習するエージェントでの実験を行い,その性質を検討した.
著者
水谷 陽太 鶴岡 慶雅
雑誌
ゲームプログラミングワークショップ2018論文集
巻号頁・発行日
vol.2018, pp.72-79, 2018-11-09

近年,深層強化学習の分野において,モデルベース強化学習に関する研究が注目を集めている.環境モデルを学習することで先読みを行うことが可能となり,長期的な計画に基づく方策決定が可能となる.ビデオゲームなどの複雑な環境において,画像を観測として用いる場合,観測を直接予測するような環境モデルを学習するのには莫大な計算コストがかかる.そのため,画像を低次元のベクトル表現に変換し,その表現における次状態の予測をする学習を行う手法がいくつか提案されている.しかし既存の手法における中間表現は,強化学習の目的においては不要なデータを含んでいたり,事前学習を必要とするなど,一長一短であった.本論文では,タスク達成に有用な中間表現を学習すると同時に,その中間表現を用いて次状態予測の学習を行う新しいモデルベース強化学習のアーキテクチャを提案する.提案するアーキテクチャは,表現の獲得と次状態予測,方策決定の全てをend-to-end で効率的に学習ができ,比較的小さな計算コストで長期的な計画に基づく方策決定を行うことが可能である.実験により,ビデオゲームの深層強化学習において提案手法を用いることで効果的な学習を行えることを確認した.
著者
山田 豊大 阿原 一志
雑誌
ゲームプログラミングワークショップ2018論文集
巻号頁・発行日
vol.2018, pp.128-132, 2018-11-09

不完全情報ゲームの1種であるトレーディングカードゲーム (TCG) は,デッキ(ゲームに使用するカードセット)をプレイヤーが選択できるなど,囲碁や将棋,その他ボードゲームにはないゲーム要素が特徴であり,強い,又は人間らしいエージェントの作成等の研究には意義があると考えられる.本稿は,単純化されたTCGで,デッキ作成,またエージェントの構築に関する知見を得ることを目標とし,その第一段階としてランダムに与えられたデッキに対してニューラルネットワークを用いた強化学習の有効性について考察した.