著者
後藤嵩幸 橋本剛
出版者
一般社団法人情報処理学会
雑誌
研究報告ゲーム情報学(GI) (ISSN:09196072)
巻号頁・発行日
vol.2014, no.7, pp.1-6, 2014-03-10

コンピュータ将棋は,Bonanza メソッドの考案により非常にレベルが高くなった.現在では,プロ棋士との対局も盛んに行われており,トッププロレベルに迫っている.しかし,中盤以降に比べて序盤が弱いという弱点も抱えている.コンピュータ将棋の性能は評価関数の質に大きく影響される.正確に盤面評価を行うほどコンピュータ将棋は強くなる.評価関数のパラメータは機械学習により自動調整されているが,40 駒からなる将棋の盤面をそのまま評価するためには膨大な評価項目が必要となる.現状では部分局面に分割することにより,近似的に評価を行なっている.しかし,現在の多くのプログラムは駒組み合わせ全てを保持するオール (all) 型の評価関数を用いているため,3 駒程度の少ない駒数にしか分割できない.そのため序盤で特に重要な盤面の細かな違いを認識することが出来ない.高次元組み合わせ評価を行うためには,重要な駒組み合わせのみを評価するフレック (frequency) 型評価関数が必要である.フレック型評価関数実現のためには,重要な評価項目を抽出する必要がある.しかし,現在重要な評価項目を自動抽出するための有効な手法は存在しない.そこで本研究では,乱数を用いた盤上の駒組み合わせのランダムカウントにより,評価項目を自動抽出する手法を提案する.実際に提案手法により抽出した項目を用いてフレック型評価関数を設計し,Bonanza に組み込んだ.そして,オール型評価関数と対局実験を行い,性能向上を確認した.

言及状況

はてなブックマーク (2 users, 4 posts)

収集済み URL リスト