著者
吉野 拓真 五十嵐 治一 川島 馨
雑誌
ゲームプログラミングワークショップ2020論文集
巻号頁・発行日
vol.2020, pp.16-21, 2020-11-06

選択探索の一種として,モンテカルロソフトマックス探索が提案されている.一般に,大規模ニューラルネットワークモデルによる評価関数を利用する場合,計算に時間がかかることから,αβ探索のような全幅探索よりは,選択探索の方が向いている. 特に,モンテカルロソフトマックス探索においては,兄弟ノード局面をまとめて評価する際に,GPU による並列計算を用いれば,評価関数が大規模なニューラルネットワークモデルであっても容易に並列化できる可能性がある.本研究では,dlshogi のソースコードを改変し,モンテカルロソフトマックス探索とニューラルネットワークモデルの評価関数を組み合わせたプログラムを作成した.特に,ニューラルネットワークモデルの入力層に提示する局面の特徴量表現を工夫することにより,GPU で兄弟局面を同時に並列計算する際の処理時間を短縮することを試みた.さらに,ノード選択方策にPolicy Network の出力値を取り入れることにより,探索精度の向上を試みた.