- 著者
-
大森 翔太朗
金子 知適
- 雑誌
- 情報処理学会論文誌 (ISSN:18827764)
- 巻号頁・発行日
- vol.57, no.11, pp.2374-2381, 2016-11-15
近年プレイヤの個性に関する研究が人工知能の分野で取り組まれ始めている.本研究では,将棋の指し手の選択に注目し,コンピュータプログラムで個性を実現する一手法を提案する.人間における指し手の選択による個性は通常棋風と呼ばれるが,客観的な基準で判定可能なプログラムの棋風について本稿では議論する.提案手法では,指し手の客観的な分類基準を実現したい棋風となるべく関連付けて定め,それに基づいて棋譜を分類し,選別された棋譜で評価関数の学習を行う.これにより,棋風を反映した評価関数が得られることを示す.主要な題材として将棋の攻めと受けという概念について,棋譜の分類と評価関数の学習を行い,得られた評価関数の性質を報告し議論する.対局実験により,攻めと受けの好みについて,意図どおりの変化が指し手に現れたことを確認した.また,提案手法で学習したプログラムと学習前のプログラムとの対戦実験から,棋力の低下は勝率40%程度に抑えられていることを確認した.There are several researches on playing styles of computer players in Artificial Intelligence research in recent years. This study proposes a method to give a computer player an intended playing style in shogi. We focus on playing styles that can be identified in an automated manner. We select a set of game records played by players having the intended playing style, based on statistical analysis proposed in existing researches. Then, we conduct a supervised learning of an evaluation function by using the selected records. The preference on attack or defense moves is used as an example of a playing style, because many moves in shogi are categorized in attack or defense. We implemented our method in shogi and evaluated the playing strength as well as how well an intended style is reproduced in self-play experiments. It is shown that learned evaluation functions have an intended playing style and that the playing strength is about 40% against original program.