- 著者
-
築地 毅
柴原 一友
- 雑誌
- ゲームプログラミングワークショップ2015論文集
- 巻号頁・発行日
- vol.2015, pp.136-142, 2015-10-30
本稿ではディープラーニングの技術を用いて麻雀の評価関数を学習することを試みる.近年ディープラーニングの技術が確立し始めており,画像認識,音声認識,自然言語処理などの分野で優れた成果を上げている.ゲームの分野でも, ディープラーニングと強化学習を組み合わせたDeep Q Network により,多種多様なゲームの学習に成功しているが,筆者の知る限り,不完全情報ゲームへの適用は行われていない.そこで本稿では,不完全情報ゲームである麻雀の評価関数をディープラーニングの各種技術を利用して獲得し,有効性を評価する初の試みに取り組む.純粋な多層ニューラルネットとして学習した場合,ニューロンの数や層の深さを大きくしてネットワークの表現力を高めることで,学習データとの一致率は最大75.1%まで上がったが,テストデータとの一致率との大きな乖離が見られ,ディープラーニングの技術を用いることなく適切な学習をすることは難しいということが分かった.ディープラーニングの技術の一つであるオートエンコーダの採用有無により,収束状況や評価関数の精度に違いが見受けられたものの,汎化性能が高まるという結果は得られなかった.また,ディープラーニングの技術の一つであるドロップアウトにより,学習の過学習を抑え,テストデータとの一致率を37.2%から43.7%へ高めることに成功した.