方策勾配法による探索制御の一考察

3 0 0 0 OA 方策勾配法による探索制御の一考察

著者: 五十嵐治一森岡祐一山本一将
雑誌: ゲームプログラミングワークショップ2014論文集
巻号頁・発行日: vol.2014, pp.90-94, 2014-10-31

コンピュータ将棋において探索木の枝を成長させる際に,その枝までの探索経路に沿った指し手の累積的な選択確率の値を基に探索制御を行う方法を提案する.このときの指し手の選択には,将棋の指し手に関するヒューリスティクスを組み込んだシミュレーション方策を使用する.この際,枝成長を決定論的に行う場合と確率的に行う2つの場合を考えた.さらに,本手法ではこのシミュレーション方策中のパラメータを強化学習の一手法である方策勾配法により学習する.

http://id.nii.ac.jp/1001/00106479/

言及状況

はてなブックマーク (1 users, 2 posts)

Twitter (2 users, 2 posts, 0 favorites)

もひとつちなみに、ひまわりが使ってる例のアレも。「方策勾配法による探索制御の一考察」五十嵐治一・森岡祐一・山本一将 https://t.co/ssd5Ggtlth

1 @espelade

3 0 0 0 OA 方策勾配法による探索制御の一考察

言及状況

はてなブックマーク (1 users, 2 posts)

Twitter (2 users, 2 posts, 0 favorites)

収集済み URL リスト