- 著者
-
五十嵐 治一
森岡 祐一
山本 一将
- 雑誌
- ゲームプログラミングワークショップ2014論文集
- 巻号頁・発行日
- vol.2014, pp.90-94, 2014-10-31
コンピュータ将棋において探索木の枝を成長させる際に,その枝までの探索経路に沿った指し手の累積的な選択確率の値を基に探索制御を行う方法を提案する.このときの指し手の選択には,将棋の指し手に関するヒューリスティクスを組み込んだシミュレーション方策を使用する.この際,枝成長を決定論的に行う場合と確率的に行う2つの場合を考えた.さらに,本手法ではこのシミュレーション方策中のパラメータを強化学習の一手法である方策勾配法により学習する.