著者
築地 毅 柴原 一友
雑誌
ゲームプログラミングワークショップ2017論文集
巻号頁・発行日
vol.2017, pp.163-170, 2017-11-03

本稿では,麻雀の捨て牌を自動選択させるのに効果的なCNN構成を提案する.近年ディープラーニングの技術が確立し始めており,特に画像認識分野において,既存の技術では困難であった特徴の自動抽出をディープラーニングおよびCNNで実現したことにより,非常に高い精度を上げるようになってきている.麻雀においてもニューラルネットワークやディープラーニングを用いた事例は発表されている.一方,麻雀特有の情報を特徴量としてコーディングしており,特徴を自動抽出するというディープラーニングの特性を活かした設計になっているとは言いがたく,人の設計の手を離れることで,さらに精度が向上する可能性はあると考えられる.そこで本稿では,麻雀の特徴を自動抽出して捨て牌を自動選択する学習を行うことを目的として,位置不変性や共有重みの概念を活かした,麻雀の学習用CNN構成を提案する.本稿で提案する牌のコーディング方法およびフィルターを組み合わせたCNN構成により,手牌と捨て牌だけという極めて単純な入力データを用いて,テストデータとの一致率を53.98%にまで上げる事に成功した.
著者
築地 毅 柴原 一友
雑誌
ゲームプログラミングワークショップ2015論文集
巻号頁・発行日
vol.2015, pp.136-142, 2015-10-30

本稿ではディープラーニングの技術を用いて麻雀の評価関数を学習することを試みる.近年ディープラーニングの技術が確立し始めており,画像認識,音声認識,自然言語処理などの分野で優れた成果を上げている.ゲームの分野でも, ディープラーニングと強化学習を組み合わせたDeep Q Network により,多種多様なゲームの学習に成功しているが,筆者の知る限り,不完全情報ゲームへの適用は行われていない.そこで本稿では,不完全情報ゲームである麻雀の評価関数をディープラーニングの各種技術を利用して獲得し,有効性を評価する初の試みに取り組む.純粋な多層ニューラルネットとして学習した場合,ニューロンの数や層の深さを大きくしてネットワークの表現力を高めることで,学習データとの一致率は最大75.1%まで上がったが,テストデータとの一致率との大きな乖離が見られ,ディープラーニングの技術を用いることなく適切な学習をすることは難しいということが分かった.ディープラーニングの技術の一つであるオートエンコーダの採用有無により,収束状況や評価関数の精度に違いが見受けられたものの,汎化性能が高まるという結果は得られなかった.また,ディープラーニングの技術の一つであるドロップアウトにより,学習の過学習を抑え,テストデータとの一致率を37.2%から43.7%へ高めることに成功した.
著者
大崎 泰寛 築地 毅 但馬 康宏 小谷 善行
出版者
情報処理学会
雑誌
研究報告ゲーム情報学(GI) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.5, pp.1-8, 2009-06-19

シミュレーションによって獲得された勝率に基づいて着手を選択する研究が近年盛んに行われている.ところが対局のオンライン時に精度の高い勝率をシミュレーションによって獲得するためには時間がかかるという問題点がある.そこで本論文では機械学習を用いて評価関数を,あらかじめ対局のオフライン時に獲得した勝率に近似する手法を提案した.そしてブロックスデュオを実験環境として,得られた勝率近似関数の学習成果について考察し,オンライン時にモンテカルロシミュレーションから着手を選択するプログラムと対局することで本手法の方が優れた対局結果を示すことを確認した.In these years, the researches of selecting moves using the winning probability obtained through simulations are treated as hot topics. However, there is a problem that obtaining the accurate winning probability through simulations needs too much time at on-line during games. In this paper, we suggested a method as to evaluation function is approximated previously by the probability of winning at off-line during games. Using BlokusDuo as a testing environment, we evaluate the learning result of approximating winning probability function and confirm that our learned player, in comparison to on-line Monte-Carlo simulation player, has been seen to yield better results of games.
著者
築地 毅 鈴木 晴也 柴原 一友 藤本 浩司 池田 龍司 尾﨑 和基 森田 克明 松原 敬信
雑誌
研究報告自然言語処理(NL) (ISSN:21888779)
巻号頁・発行日
vol.2020-NL-244, no.4, pp.1-7, 2020-06-26

本稿では,BERT を利用した教師無しデータへの適用について論ずる.近年ディープラーニングの技術が確立し始めており,特に画像認識分野において,既存の技術では困難だった特徴の自動抽出を実現したことにより,非常に高い精度を上げるようになってきている.自然言語処理においてもディープラーニングの研究は広く行われているが,近年 Google により発表された BERT の功績は大きく,教師あり学習のタスクに対して,既存の成果を大きく上回る成果を上げている.本稿では,教師あり学習の精度を大きく高めた BERT を教師無しデータに適用することで,既存手法の性能向上につながる可能性があるという仮説を主張する.本稿では,特許文書を対象に,教師あり学習を行わずに特許の類似性を図る実験を行った.実験の結果,人手で付与した特許分類フラグに対し 61.9 %の正解率となり,BERT を活用することで教師データを与えずとも,特許の類似度を表現できることを示した.