著者
甲野 佑 田中 一樹 奥村 純
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第32回全国大会(2018)
巻号頁・発行日
pp.1Z302, 2018 (Released:2018-07-30)

高次な意思決定課題では発見により行動選択肢が無際限に拡張されうる.その場合,行動の特徴表現の自律的な獲得が重要になる.そこで本研究では状態遷移軌跡から行動表現を有限長のベクトルに埋め込み,強化学習に活用する学習フレームを提案する.具体的にはカードとボードゲームの要素を併せ持つ“逆転オセロニア”を例に,拡張されうる行動要素であるキャラクターの表現を暗黙的に獲得し,戦術の学習時に転用できる事を示す
著者
甲野 佑 田中 一樹 岡田 健 奥村 エルネスト 純
雑誌
デジタルプラクティス (ISSN:21884390)
巻号頁・発行日
vol.10, no.2, pp.351-367, 2019-01-15

複数のプレイヤーからなる対戦ゲームを楽しんでもらう場合,ある1つのアイテムを持っているなどで勝敗が偏ってしまうゲームバランスは好ましくない.そのような極端な事態を招かないため,ゲームバランスについてはリリース前に慎重な検討と調整がなされる.しかしながら近年のゲームは継続的な更新により要素(キャラクター,アイテムなど)が追加され,ルールが随時変化していく.そのため制作者の意図しないゲームバランスの変化を引き起こす可能性が問題になっている.そこで我々はリリース前における正確なゲームバランス評価を目的として深層学習,特に深層強化学習に着目した.ただし近年のゲームに適用する場合,要素の追加にしたがって伸長する入出力ベクトルの大きさの扱いが問題となる.本研究ではアプリ型対戦ゲーム“逆転オセロニア”への適用を目的に,膨大な種類数のキャラクター要素の特徴ベクトルを自然言語処理由来の機械学習手法で表現学習し,深層強化学習に転用してゲームのプレイ戦術を学習する手法を提案した.また,ゲームバランス調整への深層学習応用を目指す中で得られた,他ゲームタイトルでのゲームバランス調整にも共通する知見,課題についてまとめた.
著者
甲野 佑 田中 一樹 奥村 純
出版者
一般社団法人 人工知能学会
雑誌
JSAI大会論文集
巻号頁・発行日
vol.2018, pp.1Z302, 2018-07-30

<p>高次な意思決定課題では発見により行動選択肢が無際限に拡張されうる.その場合,行動の特徴表現の自律的な獲得が重要になる.そこで本研究では状態遷移軌跡から行動表現を有限長のベクトルに埋め込み,強化学習に活用する学習フレームを提案する.具体的にはカードとボードゲームの要素を併せ持つ"逆転オセロニア"を例に,拡張されうる行動要素であるキャラクターの表現を暗黙的に獲得し,戦術の学習時に転用できる事を示す</p>