著者
川上 裕生 浦 晃 三輪 誠 鶴岡 慶雅 近山 隆
雑誌
ゲームプログラミングワークショップ2013論文集
巻号頁・発行日
pp.66-72, 2013-11-01

将棋プログラムの評価関数は大量の棋譜を利用した機械学習によって調整する。これにはプロ棋士の棋譜が用いられているが棋譜の数には限りがあり、新たに指し手の教師情報のついた局面を作成するには大きなコストが必要となる。本稿では、教師情報を付けるコストを削減するために、能動学習を用いて学習に有効に働く局面を選択する手法を提案する。既存の棋譜を用いて提案手法の評価を行ったところ、将棋の評価関数の学習に有効な局面が存在し、その選択が可能であることを示した。