著者
保木 邦仁
出版者
分子科学会
雑誌
Molecular Science (ISSN:18818404)
巻号頁・発行日
vol.6, no.1, pp.A0050, 2012 (Released:2012-06-21)
参考文献数
16

This article reviews recent advances in computer games. It is explained that methods famous in computational chemistry have enhanced the performance of Go and shogi programs. A history of the grand challenge in computer science that aims to defeat human experts in games is briefly summarized.
著者
佐藤 諒 西村 夏夫 保木 邦仁
出版者
一般社団法人情報処理学会
雑誌
研究報告ゲーム情報学(GI) (ISSN:09196072)
巻号頁・発行日
vol.2014, no.11, pp.1-6, 2014-03-10

本研究では,シャンテン数が下がるような牌を有効牌とし,数手先の有効牌を数え上げることによって牌効率を向上させた麻雀 AI の性能を評価することを目的とした.簡単のために副露や降りをしない面前全ツッパに麻雀AIの戦略を制限した.性能評価は,インターネット雀荘 「東風荘」 で人間のプレイヤーと対局させ,安定レートや他の統計情報を利用して行った.In this work, we analyze the performance of Mahjong AI programs that count the number of effective legal moves. Here, an effective legal move decreases Shanten numbers (the number of tiles away from tempai). For the sake of simplicity, we limit the strategy of AI programs to Menzen-Zentsupa strategy (no open melds by calling and no defense by discarding safe tiles). The performance is measured in the internet Mahjong server, Tonpu-So, with human players and it is analyzed in terms of rating and other statistic information.
著者
保木 邦仁
出版者
一般社団法人情報処理学会
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.47, no.8, pp.884-889, 2006-08-15
被引用文献数
8

5月に行われたコンピュータ将棋選手権において,拙作の Bonanza が接戦のリーグ戦をすり抜け,幸運に助けられながらも優勝することができた.Bonanza の思考アルゴリズムは,チェスで広く用いられている全幅探索の手法に基づく.将棋においても,全幅探索が有効な手法の一つになり得ることが示された.本原稿では,このプログラムの仕組みを,探索アルゴリズムの概要と,特に将棋ドメインにおける futility pruning の応用に的を絞り,解説する.Futility pruning を行うことによるプログラムの棋力上昇が,次の一手問題の正答率に基づいて示された.
著者
保木 邦仁
出版者
情報処理学会 ; 1960-
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.54, no.9, pp.928-932, 2013-08-15

The University of Electro-Communications アブストラクト:2005年に拙作のプログラムBonanzaをインターネットに公開,以降2006年からコンピュータ将棋協会が毎年5月に開催する選手権に出場し続けている.今年の5月で8回目の出場となり,戦績は優勝2回,2位1回,3位1回,4位1回,5位2回,9位(予選落ち)1回である.Bonanzaの戦績には実力だけでなく運の要素も強く反映されている.二度優勝してはいるが,それぞれ一局ずつ,将棋の内容では負けていながら相手プログラムの不合理な動作により勝っている.本稿では,選手権においてトップ争いを繰り広げてきたBonanzaに施された工夫の一部をハードウェア構成と評価関数の観点から簡単に紹介する.
著者
保木 邦仁
雑誌
ゲームプログラミングワークショップ2006論文集
巻号頁・発行日
vol.2006, pp.78-83, 2006-11-10

将棋プログラムBonanzaの思考アルゴリズムの主要な特徴の一つである,局面評価の機械学習に関する手法を紹介する.これの手法では,minimax探索の振る舞いを決める特徴ベクトルの自動学習を目指す.熟練した人間の棋譜との指し手一致の度合いを図る目的関数を設計し,これに停留値を与える静的評価関数f(v)の特徴ベクトルvを求める.さらに,v=0となる自明な解の除去や,棋譜サンプル数の不足に起因するオーバーフィッティングを回避するため,ラグランジュ未定乗数法を用いて目的関数に拘束条件を課す.目的関数の停留値は静的評価関数の勾配∇f(v)を用いて探索される.これは,古くから知られている最適制御理論の枠組みに沿った手法である.しかし,約6万局の学習データから1万以上の要素を持つ特徴べくとるを生成し,駒割に加え序盤の駒組,中盤の駒の動き,終盤の速度計算等の複雑な盤面特徴の把握が必要とされる将棋において,有効に働く局面評価関数が生成された.筆者に知る限り,本稿で提案される手法は,チェスやその変種の静的評価関数の自動学習法として”実用に耐え,役に立つ”初めてのものである.
著者
伊藤 毅志 小幡 拓弥 杉山 卓弥 保木 邦仁
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.52, no.11, pp.3030-3037, 2011-11-15

本論文では,将棋プログラムの新たな並列処理手法を提案する.このアルゴリズムは,複数の思考プログラムの候補手の中から一つの手を選択する手法である.このアルゴリズムを合議アルゴリズムと呼ぶ.本論文では,将棋における合議手法の提案と評価を行い,また単一プログラムからでも乱数を用いた合議手法を提案しその有効性も示した.さらに,YSS,GPS将棋,Bonanza等の有名な強豪プログラムをこの合議アルゴリズムで組み合わせることで,その各々のプログラムよりも強くなることを示した.
著者
保木邦仁
雑誌
研究報告アルゴリズム(AL)
巻号頁・発行日
vol.2012, no.5, pp.1-1, 2012-03-07

将棋は西洋のチェスと同じルーツを持つゲームと考えられている。そのため、将棋とチェスのルールには類似点が多い。その一方で、持ち駒ルールのように異なった性質もある。このようなルール上の違いは、人工知能及びアルゴリズム設計の難易度に大きな影響を与えた。実際、IBM ディープ・ブルーが 1997 年にチェスの世界チャンピオンを破った時でも、当時のコンピュータ将棋の棋力は通常のアマチュアプレイヤー以下であった。コンピュータ将棋が人間トップに迫るほどの棋力を獲得したのはごく最近である。2010 年はあから 2010 が清水市代女流王将に勝利し、2011 年には Ponanza が著名なインターネット対局場 (将棋倶楽部 24) の短時間対局で最高レーティングを獲得、また 2012 年にはボンクラーズが米長邦雄永世棋聖に勝利した。本公演では、最近のコンピュータ将棋の動向に加えて、強いプログラムの一つである Bonanza の思考の仕組みを紹介する。高精度評価関数の最適化や、力ずく探索の枝刈り手法について、将棋とチェスの違いを示す。
著者
栗田 萌 保木 邦仁
雑誌
研究報告ゲーム情報学(GI) (ISSN:21888736)
巻号頁・発行日
vol.2017-GI-38, no.5, pp.1-8, 2017-07-08

本研究では,麻雀において他プレイヤの手牌または待ちの予測を行うことで,打牌を行う際の放銃確率をその点数ごとに推定する手法を提案する.他プレイヤのフーロ数に基づいて,手牌の予測を行うか,待ちの予測を行うかを決定し,この予測結果から自プレイヤの打牌ごとの放銃確率を計算する.提案した手法で放銃確率の推定値を算出し実測値と比較したところ,その差が 1 % 程度となる結果が得られた.
著者
久米 洋輝 栗田 萌 保木 邦仁
雑誌
研究報告ゲーム情報学(GI) (ISSN:21888736)
巻号頁・発行日
vol.2019-GI-41, no.14, pp.1-7, 2019-03-01

本研究の目的は、麻雀プレイヤの実力を少ない行動記録から推定することである.実力の推定は、麻雀人工知能(AIプレイヤ)を用いてエラーレートを評価することによりなされる.エラーレートとはバックギャモンで用いられるプレイヤの実力の指標であり,これは1行動あたりの推定価値(得点期待値)の減少平均値から見積もられる.現状,麻雀プレイヤの実力は平均順位やレート値から推定される.本研究では,エラーレートと平均順位の平均レート推定性能を比較した.その結果,おおよそ16試合の行動記録から評価したエラーレートと500試合の平均順位が同程度の推定性能である可能性が示された.
著者
保木 邦仁
雑誌
情報処理
巻号頁・発行日
vol.47, no.8, pp.884-889, 2006-08-15

5月に行われたコンピュータ将棋選手権において,拙作の Bonanza が接戦のリーグ戦をすり抜け,幸運に助けられながらも優勝することができた.Bonanza の思考アルゴリズムは,チェスで広く用いられている全幅探索の手法に基づく.将棋においても,全幅探索が有効な手法の一つになり得ることが示された.本原稿では,このプログラムの仕組みを,探索アルゴリズムの概要と,特に将棋ドメインにおける futility pruning の応用に的を絞り,解説する.Futility pruning を行うことによるプログラムの棋力上昇が,次の一手問題の正答率に基づいて示された.
著者
松井 亮平 保木 邦仁
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.59, no.11, pp.2063-2073, 2018-11-15

不確定性を持ち,ストーン配置やショットが浮動小数点数で表されるデジタルカーリングを題材に,一般化方策反復に基づく強化学習の一手法を検討した.強化学習はおおよそカーリングの予備知識を用いない行動集合とランダム方策から開始した.行動価値は重みの総数1,000万ほどの畳込みニューラルネットワークを用いて,挙動方策が生成した総数6億ほどの行動から推定した.行動集合が巨大であるため,グリーディ方策はモンテカルロ法により近似的に求めた.この実験によりグリーディ方策がサンプルプログラムに比する程度の強さを持ち,初歩的なショット知識に基づいた行動をとるようになる過程を明らかにした.
著者
杉山 卓弥 小幡 拓弥 斎藤 博昭 保木 邦仁 伊藤 毅志
雑誌
ゲームプログラミングワークショップ2009論文集
巻号頁・発行日
vol.2009, no.12, pp.59-65, 2009-11-06

コンピュータ将棋において,複数のクライアントの意見から1 つの指し手を選択する合議アルゴリズムが注目されている.非常にシンプルな手法ながら,この合議アルゴリズムによって,思考エンジンの性能改善が報告されている.本研究では,各クライアントの指し手に加えて,局面の優劣評価の値も利用する新しい合議法について報告する.正規乱数を用いて局面評価値を修正し生成された複数クライアントから,最大の評価値を付けたクライアントの意見を採用する楽観的合議法を提案し,その有効性と仕組みについて議論する.
著者
伊藤 毅志 保木 邦仁 西野 哲朗 棟方 渚 片寄 晴弘 池田 心
出版者
電気通信大学
雑誌
基盤研究(B)
巻号頁・発行日
2013-04-01

本研究では、ゲームにおける人間のミスに着目し、人間らしいミスを犯すゲームAIの構築を目指し、以下の研究成果を得た。1)ゲームにおける人間の犯すミスの原因に着目した分類。2)人間の生物学的成約を考慮したモデルを持ったゲームAIの構築。3)ゲームにおける技量を自動的に調整して良い勝負を演出できるゲームAIの提案と評価。4)人間の思考の特徴である「流れ」を持たせ、人間らしいプレイを実現するゲームAIの提案。これらの研究の成果は、人間と対戦するゲームAIに「強さ」という方向性以外の新しい評価基準をもたらし、多様なゲームAIの指針となると考えられる。
著者
保木 邦仁
出版者
日本知能情報ファジィ学会
雑誌
知能と情報 (ISSN:13477986)
巻号頁・発行日
vol.26, no.5, pp.216, 2014-10-15 (Released:2017-11-18)

現在の将棋プログラムは,計算資源の殆どをミニマックス木の探索に費やす.ミニマックス木は,ゲームの状態間の手による遷移及び評価値を表す.この木の平均的な分岐因子は80程度もあることから,現実的な対局時間で5手以上先を読むためには,枝刈りにより木探索の効率化を図る必要がある.ミニマックス木探索における枝刈り法は2つの種類に分けられる.ひとつは,a b 探索に代表される安全な枝刈りであり,探索の値を変えることなく木の枝が刈られる.a b 探索の他にもアスピレーション探索[1] がよく用いられている.もうひとつの種類は,前向き枝刈り法と呼ばれる,探索の値を変えてしまう可能性のあるものである.前向き枝刈り法のうち,Futility pruning,null move pruning 及び late move reduction 法の将棋における性能調査が文献[ 2]に示されている.他にも,ハッシュテーブルを用いた枝刈り法や Static ExchangeEvaluation[3]の値に基づく枝刈り法などもよく用いられている.これら枝刈り法は現在のコンピュータチェスにおいて成功している方法である.将棋独自の性質を利用した枝刈りも研究されてきたが,Bonanza がチェスの枝刈り法を組み合わせただけでも十分将棋に効果があることを示して以降,チェスプログラムの技術への注目が再び高まっている.[1] H. Kaindl, R. Shams, H. Horacek, Minimax search algorithms with and without aspiration windows, IEEE Transaction on Pattern Analysis and Machine Intelligence 13 pp.1225-1235(1991).[2] K. Hoki & M. Muramatsu, Efficiency of three forward-pruning techniques in shogi: Futility pruning, nullmove pruning, and late move reduction( LMR). Entertainment Computing, 3, pp.51-57(2012).[3] F. Reul, Static exchange evaluation with α-β-approach, ICGA Journal 33, pp.3-17(2010).
著者
保木 邦仁
雑誌
情報処理
巻号頁・発行日
vol.54, no.9, pp.928-932, 2013-08-15

The University of Electro-Communications アブストラクト:2005年に拙作のプログラムBonanzaをインターネットに公開,以降2006年からコンピュータ将棋協会が毎年5月に開催する選手権に出場し続けている.今年の5月で8回目の出場となり,戦績は優勝2回,2位1回,3位1回,4位1回,5位2回,9位(予選落ち)1回である.Bonanzaの戦績には実力だけでなく運の要素も強く反映されている.二度優勝してはいるが,それぞれ一局ずつ,将棋の内容では負けていながら相手プログラムの不合理な動作により勝っている.本稿では,選手権においてトップ争いを繰り広げてきたBonanzaに施された工夫の一部をハードウェア構成と評価関数の観点から簡単に紹介する.