著者
小林 祐樹 Yuki Kobayashi
出版者
電気通信大学
巻号頁・発行日
2016-03-25

本論文では, モンテカルロ木探索を用いた囲碁プログラムのデータ構造を考え, 学習手法やヒューリスティックの有無がプログラムの強さにどのように影響するかを考察した.モンテカルロ木探索は木探索部とシミュレーション部に分けられ, さらにシミュレーション部は大きく2つに分けられる. 1つは盤全体の着手確率のテーブルを保持して, その中からランダムに着手を選ぶ非決定論的シミュレーションであり, もう1つは直前の着手に対応する良さそうな手があったら, 即座にその手を選ぶ決定論的シミュレーションである. 決定論的シミュレーションを行うオープンソースソフトウェアにPachi やFuego などがあるが, それらと同等の棋力を持つ非決定論的シミュレーションを行うオープンソースソフトウェアは存在しない.本研究では, 非決定論的シミュレーションを用いる囲碁プログラムを設計し, Pachi やFuego よりも強い囲碁プログラムの開発を目指した.プログラムに利用している学習手法の妥当性や, ヒューリスティックの有効性を示し, 13路盤と19路盤ではPachi とFuego よりも強いプログラムを開発できた.非決定論的シミュレーションを行うプログラムを作成し, オープンソースソフトウェアとすることで, 様々な手法の有効性を2つのシミュレーション手法の違いを含めて検証できるようになった.