著者
山本 一成 竹内 聖悟 金子 知適 田中 哲朗
雑誌
ゲームプログラミングワークショップ2010論文集
巻号頁・発行日
vol.2010, no.12, pp.42-48, 2010-11-12

本稿では,将棋においてMagicBitboardを適用する手法を提案する.Bitboardはチェスなどの二人ゲームのゲーム木探索で盤面を表現するのに適した手法であり,チェスや将棋の強いプログラムで広く使われている.MagicBitboardは従来のBitboardの手法に比べ,よりシンプルなデータ構造を管理するだけで利きを算出することが可能となる近年開発された手法である.MagicBitboardはチェスの盤面が一つの64ビット整数で表現できることに依存した手法であり,盤面のマス目の数が81マスの将棋で,MagicBitboardを使う方法は知られていなかった.しかし我々は初めて,複数の整数で表現された盤面においてMagicBitboardを使って利きを算出する手法を発明し,Bonanzaを使った実験で我々の手法の効果を示した.
著者
金子 知適 田中 哲朗 山口 和紀 川合 慧
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.48, no.11, pp.3438-3445, 2007-11-15
参考文献数
17
被引用文献数
2

将棋の評価関数として,駒(所有者,種類,位置を含む)の2 項関係を評価するモデルと,棋譜を使った自動的な調整方法を提案する.将棋の評価関数では駒の損得を基本としたうえで,駒の働きや玉の危険度など様々な評価項目が用いられている.しかしそのような駒の損得以外の評価項目は設計が難しく,また自動的な値の調整も困難であった.本稿では,駒の関係という単純な評価項目を提案し,既存の評価項目の多くが駒の関係により表現可能であることを示す.さらに,棋譜で指された指手と指されなかった手の差分に注目した判別分析を行うことで,重みを自動的に調整することを提案する.実際に評価関数を作成したところ,形を評価する実験で良い結果が得られた.さらに,対戦でも提案した評価関数を使ったプログラムが有為に勝ち越し,提案手法の有効性が示された.New evaluation function in shogi, based on pairwise piece relations, and a method for automated tuning of their weights are presented. Existing evaluation functions treat a lot of specific aspects, as well as material balance, of the game. Most of such aspects can, we show, be handled by the proposed method. Then, we automatically adjust the weights of pairwise piece relations, by means of discriminant analysis of many game records. Our experiments showed that reasonably accurate evaluation functions for preferable configuration of pieces can successfully be constructed. Moreover, significant improvement on strength was confirmed in self-play.
著者
大森 翔太朗 金子 知適
雑誌
ゲームプログラミングワークショップ2015論文集
巻号頁・発行日
vol.2015, pp.32-39, 2015-10-30

近年プレイヤの個性に関する研究が人工知能の分野で取り組まれ始めている. 本研究では, 将棋の指し手の選択に注目し, コンピュータプログラムで棋風を実現する方法について提案する. 棋風としては, プレイヤが攻めや受けなど特徴を持つ指し手を選ぶ傾向についてに着目する. 棋風を統計的に分析した過去の研究を参考に攻めの特徴と受けの特徴を決め, 攻めと受けの棋風について, それぞれの特徴の現れているプレイヤの棋譜を選別する. そしてそれらの棋譜を教師に評価関数の機械学習を行う. 攻めの棋譜と受けの棋譜と分類して, 今回学習に使用する棋譜のパラメータへの影響を盤面図に色の濃度で表し, 攻めの棋譜と受けの棋譜で学習の際に影響が大きそうなところを確認した. また提案手法で学習したプログラムと学習前のプログラムで対戦実験を行い, 学習がうまくできているかどうかを確認した. さらに学習に使用した攻めの棋譜と受けの棋譜の一致率を攻めの棋譜を学習させたプログラムと受けの棋譜を学習させたプログラムで測り, それぞれのプログラムに違いを確かめた. 棋風の検証では, 受けに関する次の一手問題を題材に学習前のプログラムと比べてどういった違いがあったのかを確認した.
著者
金子 知適
出版者
情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.53, no.11, pp.2525-2532, 2012-11-15

コンピュータ将棋の強さは,プロ棋士の強さに達しつつあると評価されている.そこで,本稿ではこのコンピュータ将棋の強さを活かして,プロ棋士の将棋の対局における現在の局面の形勢等を,自動でリアルタイムに解説するシステムを提案する.オープンソースプログラムのGPS将棋と,twitter.com等の情報基盤を利用したシステムを構築・公開し,実際にユーザから好評を得た.本稿で分析した27の対局について,プロ棋士の指手の過半数を正しく予測し,また形勢判断もおおむね対局の流れを表していた.統計と具体的な局面の分析の両方の側面から,十分に観戦の参考になる形勢判断と読み筋を,現在のコンピュータ将棋によって提供することが可能であることが示された.It is widely recognized that the strength of state-of-the-art computer Shogi programs is approaching to that of professional players. This paper presents a real-time commentary system of Shogi games, based on the analyses by computer programs. The presented system was implemented by using an opensource shogi program and twitter.com, and have been received favorable comments by users. In the experimental results, statistical and detailed analyses on 27 game records are discussed. It has been observed that the presented system correctly predicted more than fifty percents of the moves selected by experts, and that the evaluation of positions were almost compatible with comments given by professional players.
著者
中屋敷 太一 金子 知適
雑誌
ゲームプログラミングワークショップ2018論文集
巻号頁・発行日
vol.2018, pp.1-8, 2018-11-09

近年コンピュータ将棋プログラムは対局で人間のプロ棋士に勝利し,棋力は人間のプロ棋士を超えたと言われている.一方で,将棋プログラムによる将棋の局面の解説は,局面の勝率予測や次の指し手の予想ではある程度成功しているものの,それが何を根拠に決定されたかという内容を説明する手法はまだ確立されていない.もし将棋プログラムの判断の根拠を,プログラムが自動で,プログラムの利用者に説明することができれば,人間の棋力向上のサポートなどに用いることができ有用である.本稿では,画像分類を行うニューラルネットワークに対して考案された顕著性抽出手法を,将棋プログラムに用いられているニューラルネットワークに適用した.また,顕著性抽出手法は元の画像のどの部分に注目して判断したのかを可視化する技術であるが,可視化する際にいくつかの手法が考えられるため,本稿ではそれらの手法の差異を検討した.
著者
竹内 聖悟 林 芳樹 金子 知適 山口 和紀 川合 慧
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.48, no.11, pp.3446-3454, 2007-11-15

勝率と評価値の関係に基づいた問題点の発見手法を提案し,その有効性を示す.強いプログラムの作成には良い評価関数が不可欠だが,既存の評価関数の問題点の発見や評価値の適切な調整には,対戦などの試行錯誤が必要であり困難であった.本研究ではまず,問題点の発見手法として,評価関数が与える評価値に対する勝率に着目しそのグラフを描くことを提案し,評価関数に欠陥が存在する場合には複数の線として明確に図示されることを示す.さらに,欠陥を解決した評価関数では評価値に対する勝率のグラフが条件によらず一本化されるため,グラフにより評価関数の改善を確認できることを示す.実際に将棋,チェス,オセロについて評価関数の欠陥を図示ができることを示し,将棋においてはその改善がグラフで確認できることを示す.さらに自己対戦から実力が改善されていることを確認した.
著者
小田原 大 金子 知適 川合 慧
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ゲーム情報学(GI) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.64, pp.33-40, 2004-06-18

コンピュータパズルの倉庫番のソルバにおける課題は、手詰りの局面を効率良く検出することであり、特に袋小路の判定は難しい問題として知られている。既存の手法では判定に再帰的な探索を必要とするため、判定の効率が悪い。本稿では、袋小路を含めた「手詰り」状態の一般的な判定方法を提案し、それを探索に組合せることを提案する。具体的には問題を区域に分割し、ユニットと呼ばれる各区域の状態の組合せによって効率的に手詰りの状態を判定する。実際に倉庫番の問題に適用したところ、既存の手法では判定が難しい局面に対しても手詰りと判定することに成功した。A new method of detecting deadlock states is proposed. We define unit as a part of a map, and decompose a map into units. Each unit has gateways. The keeper can enter the unit through some gateways depending on status of other areas. We judge whether the entire state is a deadlock or not by using combination of local status of units. As a result, we could express a lot of deadlocks and showed ways of applying it to effective search.
著者
山下 修平 金子 知適 中屋敷 太一
雑誌
ゲームプログラミングワークショップ2022論文集
巻号頁・発行日
vol.2022, pp.1-8, 2022-11-04

1 人用ゲーム2048 は強化学習手法の性能の評価の題材として適している.これまで行われてきた得点による評価に加えて,最適方策との比較を定量的に行えるとより良い.そこで本研究では2048 を3 × 3 盤面に縮小したゲームであるミニ2048 を考案した.ミニ2048 はオリジナルの2048 の興味深い性質を受け継ぎつつ,盤面の小ささから完全解析を行うことができる.完全解析ではミニ2048 の状態数,最適方策に従ったときに得られる得点などの指標に加えて遷移モデルを少し変更したときの変化についても調査する.さらにミニ2048 においてStochastic MuZero を簡略化した手法でエージェントを学習させ,その性能を最適方策との一致率で評価した.最後に最善手と最悪手の期待得点の差が大きい盤面を集中的に学習することがエージェントの学習に重要なことを示した.
著者
今川 孝久 金子 知適
雑誌
ゲームプログラミングワークショップ2014論文集
巻号頁・発行日
vol.2014, pp.145-150, 2014-10-31

UCT は囲碁やGeneral Game Playing などの応用で効果を発揮している探索手法で,多腕バンディット問題のアルゴリズムであるUCB1 をモンテカルロ木探索(MCTS) に応用したものである.多腕バンディット問題には,KL-UCB, Thompson Sampling, UCB1-Tuned などUCB1 より優れるとされる様々なアルゴリズムが提案されてきている. そこで本研究では、UCB1 に変えてそれらのアルゴリズムをMCTS に用いることを提案し,実際の性能についてP-game と呼ばれる仮想的なゲーム木を用いて分析した. 実験の結果,UCB1 よりもKL-UCB, Thompson Sampling, UCB1-Tuned がMCTS においても優れることが,期待通りに確認された.ただし,各アルゴリズムの差よりも各仮想的なゲーム木の性質に因る性能の違いの方が大きいことも同時に確認されている.本稿で用いたP-game は,広く探索アルゴリズムの性能の評価で用いられているが,MCTS の評価に用いる場合は,木の作り方に注意を払う必要がある可能性がある.
著者
中屋敷 太一 金子 知適
雑誌
ゲームプログラミングワークショップ2019論文集
巻号頁・発行日
vol.2019, pp.86-93, 2019-11-01

AlphaZero は同一のアルゴリズムで強いプレイヤを作成できることを将棋,チェス,そして囲碁の3 つのゲームのそれぞれで示した.しかし AlphaZero の手法は,どのくらいの学習でどのくらい強くなるかなどを理論的に解析することは難しく,プレイヤ強さを測るには実験的に行うしかない.本稿ではAlphaZero の手法で学習を行ったニューラルネットワークがどの程度正しい判断をしているかを,すでに完全解析されたゲームであるどうぶつしょうぎを用いて,完全解析結果と比較し測定した.また異なる大きさのニューラルネットワークを用いて実験を行い,ニューラルネットワークの大きさによる影響を測定した.さらに完全解析結果を用いた教師あり学習も行い,ニューラルネットワークの大きさそのものによる性能比較も行った.最後に AlphaZero が指し手決定の際に用いている探索アルゴリズムである.Monte-Carlo Tree Search について,そのハイパーパラメータによる違いを簡単に調査した.実験の結果,教師あり学習の場合には大きいニューラルネットワークほどよい性能である一方で,AlphaZero の手法で用いる際には必ずしもそうではないことを示した.また Monte-Carlo Tree Search のハイパーパラメータによって探索の挙動が大きく変わることを示した.
著者
大森 翔太朗 金子 知適
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.57, no.11, pp.2374-2381, 2016-11-15

近年プレイヤの個性に関する研究が人工知能の分野で取り組まれ始めている.本研究では,将棋の指し手の選択に注目し,コンピュータプログラムで個性を実現する一手法を提案する.人間における指し手の選択による個性は通常棋風と呼ばれるが,客観的な基準で判定可能なプログラムの棋風について本稿では議論する.提案手法では,指し手の客観的な分類基準を実現したい棋風となるべく関連付けて定め,それに基づいて棋譜を分類し,選別された棋譜で評価関数の学習を行う.これにより,棋風を反映した評価関数が得られることを示す.主要な題材として将棋の攻めと受けという概念について,棋譜の分類と評価関数の学習を行い,得られた評価関数の性質を報告し議論する.対局実験により,攻めと受けの好みについて,意図どおりの変化が指し手に現れたことを確認した.また,提案手法で学習したプログラムと学習前のプログラムとの対戦実験から,棋力の低下は勝率40%程度に抑えられていることを確認した.There are several researches on playing styles of computer players in Artificial Intelligence research in recent years. This study proposes a method to give a computer player an intended playing style in shogi. We focus on playing styles that can be identified in an automated manner. We select a set of game records played by players having the intended playing style, based on statistical analysis proposed in existing researches. Then, we conduct a supervised learning of an evaluation function by using the selected records. The preference on attack or defense moves is used as an example of a playing style, because many moves in shogi are categorized in attack or defense. We implemented our method in shogi and evaluated the playing strength as well as how well an intended style is reproduced in self-play experiments. It is shown that learned evaluation functions have an intended playing style and that the playing strength is about 40% against original program.

2 0 0 0 OA P2P人狼BBS

著者
吉本 晴洋 繁富利恵 副田 俊介 金子 知適 田浦 健次朗
雑誌
ゲームプログラミングワークショップ2006論文集
巻号頁・発行日
vol.2006, pp.191-194, 2006-11-10

本稿では人狼BBS というゲームをP2P 上で安全に行なうためのプロトコルを提案する。P2P での実装はサーバの管理が不要というメリットがあるが、信頼できる第三者がいないため、プレイヤーが不正を行うことができてしまう。本研究では匿名通信路やゼロ知識証明などの暗号技術を用いて不正を防止するプロトコルを提案した。
著者
金子 知適
雑誌
情報処理
巻号頁・発行日
vol.55, no.8, pp.857-857, 2014-07-15
著者
出村 洋介 金子 知適
雑誌
ゲームプログラミングワークショップ2023論文集
巻号頁・発行日
vol.2023, pp.111-118, 2023-11-10

経験の多様性と不偏性は強化学習エージェントの性能や頑健性を向上させるが,大きな計算コストなしにそれを実現するのは困難な場合がある.多くのチェスライクゲームやオセロなどでは,初期状態(初期局面の駒配置等)が固定されていて 1 通りしかないため,AlphaZero スタイルの強化学習を行う場合,エージェントは似たようなエピソードや棋譜を経験しがちである.本論文では,この課題に対応するため,将棋の初期局面を拡張した「将棋 81 万」を提案し,将棋における有効性を実験的に評価する.「将棋 81 万」は,チェス 960 [1] と同様に駒の初期配置を一定の制約のもとでランダムにシャッフルして作成された将棋の初期局面集である.我々は,Gumbel AlphaZero の手法で 1000 万局の自己対局を行って様々なエージェントを訓練する実験を行い,最初に将棋 81 万で事前学習を行った後に通常の将棋に適応学習させたエージェントは,通常の将棋のみで訓練したエージェントよりも人間の対局で見られる様々な戦型において平均的パフォーマンスや頑健性が向上することを示した.