著者
後藤嵩幸 橋本剛
出版者
一般社団法人情報処理学会
雑誌
研究報告ゲーム情報学(GI) (ISSN:09196072)
巻号頁・発行日
vol.2014, no.7, pp.1-6, 2014-03-10

コンピュータ将棋は,Bonanza メソッドの考案により非常にレベルが高くなった.現在では,プロ棋士との対局も盛んに行われており,トッププロレベルに迫っている.しかし,中盤以降に比べて序盤が弱いという弱点も抱えている.コンピュータ将棋の性能は評価関数の質に大きく影響される.正確に盤面評価を行うほどコンピュータ将棋は強くなる.評価関数のパラメータは機械学習により自動調整されているが,40 駒からなる将棋の盤面をそのまま評価するためには膨大な評価項目が必要となる.現状では部分局面に分割することにより,近似的に評価を行なっている.しかし,現在の多くのプログラムは駒組み合わせ全てを保持するオール (all) 型の評価関数を用いているため,3 駒程度の少ない駒数にしか分割できない.そのため序盤で特に重要な盤面の細かな違いを認識することが出来ない.高次元組み合わせ評価を行うためには,重要な駒組み合わせのみを評価するフレック (frequency) 型評価関数が必要である.フレック型評価関数実現のためには,重要な評価項目を抽出する必要がある.しかし,現在重要な評価項目を自動抽出するための有効な手法は存在しない.そこで本研究では,乱数を用いた盤上の駒組み合わせのランダムカウントにより,評価項目を自動抽出する手法を提案する.実際に提案手法により抽出した項目を用いてフレック型評価関数を設計し,Bonanza に組み込んだ.そして,オール型評価関数と対局実験を行い,性能向上を確認した.
著者
野津 佑太 後藤 嵩幸 橋本 剛
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.123-128, 2016-10-28

コンピュータ将棋の評価関数は,Bonanzaメソッドの考案により機械学習で値を決めることが一般になり,格段にレベルが向上した.現在では,プロ棋士との対局で勝利するなど,トッププロの実力を追い越そうとしている.しかし,中盤以降に比べて序盤が弱いという弱点も抱えている.将棋プログラムの強さは評価関数の精度で決まる.40駒からなる将棋の盤面を評価する際,一般には局面を駒数個からなる部分局面に分割し,足し合わせて評価を行う.現在の多くのプログラムは,駒組み合わせ全てを保持する評価関数を用いているため,3駒程度の少ない駒数にしか分割できない.そのため,序盤で特に重要な盤面の細かな違いを認識することが出来ない.高次元組み合わせ評価を行うためには,重要な駒組み合わせのみを評価する評価関数が必要である.後藤は,重要な駒組み合わせのみを抽出する評価項目自動抽出法を提案し,高次元組み合わせ評価が可能となることを示唆した.しかし,学習や対局中の探索時間が大幅に増加し,まだ実用レベルには至っていない.そこで本研究では,評価項目自動抽出法の高速化手法を提案する.高速化手法を実装し,高速化前のプログラムと速度比較実験・対局実験を行い,性能向上を確認した.