著者
野口 陽来 松井 利樹 小森 成貴 橋本 隼一 橋本 剛
雑誌
ゲームプログラミングワークショップ2007論文集
巻号頁・発行日
vol.2007, no.12, pp.144-147, 2007-11-09

朝日放送が製作しているテレビ番組に「パネルクイズアタック 25」がある. このクイズ番組を見る限り, 解答者は全ての問題に答えようとしている. しかし, クイズの正解が分かっても解答しないほうが有利な状況があるのではないかと考えた. そこで局面の解析にはモンテカルロ法を用いて, どのパネルを獲得しても不利になる状況を見つけ出した. その結果不利になる局面は全体の 3.8%に上ることが判明した. また不利になる局面の代表的な例として一問目を答えた人は二問目を答えない方がよいという例を示した.さらにパネルを選択する戦略についても提案した.
著者
富沢 大介 池田 心 橋本 隼一
雑誌
ゲームプログラミングワークショップ2011論文集
巻号頁・発行日
vol.2011, no.6, pp.9-16, 2011-10-28

1991年にコンパイルから発売された対戦型パズルゲームぷよぷよにおいてコンピュータAIの強さは4~5連鎖程度であり,中級者以上が満足できるレベルではなかった.本研究では,ぷよぷよのAIを強くすることを目的として,強いぷよぷよのプレイヤーに必要な要素の内の一つである,長い連鎖を効率的に組むことに着目し,囲碁の“定石”や将棋の“囲い”にあたる人智の結晶である“定型連鎖”を構成する方法に取り組む.関連性行列という形での状態表現・テンプレート表現を用いた構成法により,定型連鎖を構成することに成功した.さらに従来の探索型連鎖構成法を組み合わせることで従来法を上回る平均11.75連鎖を達成することに成功した.
著者
松井 利樹 橋本 剛 橋本 隼一 野口 陽来
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ゲーム情報学(GI) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.59, pp.9-15, 2008-06-20
被引用文献数
1

本研究ではボナンザメソッドに進行度を用いた評価関数の学習法を提案する。将棋では一般的に序盤は駒の損得、終盤では寄せの速度が重要と言われており、ゲームの進行に応じて適切な値が変動していると考えられる。しかし、序盤から終盤まで単一な局面評価ではどうしても値が平均化されてしまうので良い値を得られないことがしばしばある。そこで従来の将棋プログラムで使われてきた局面の進行具合を表す変数(進行度)を使って表現し、より精度の高い評価関数を設計した。自己対戦の結果より提案した手法の有効性を確認した。In the domain of shogi, the most important factors fluctuate depending on game progress. However usual evaluation functions consist from only one coefficient vector which is calculated as average of entire games. In this paper we propose a new method to handle the problem using a game progress criterion, called shinkoudo. The results of self-play games show that the proposed idea works efficiently.
著者
橋本 隼一
出版者
北陸先端科学技術大学院大学
雑誌
特別研究員奨励費
巻号頁・発行日
2008

本研究の目的はminimax探索を基盤とするコンピュータ将棋プログラムに言語処理で培われてきたアルゴリズムを導入し,特にn-gram統計を利用したヒューリスティックを用いて強化を図り名人レベルのプログラムを実現することであった.実際,昨年度導入したn-gramを用いたキラーヒューリスティックや,浅いレベルに限定したヒューリスティックの利用は本研究室で開発を行ってきたコンピュータ将棋TACOSの強化に寄与し,その名前が先日情報処理学会から日本将棋連盟に送られた挑戦状において「名人に伍する力ありと情報処理学会が認めるまでに強いコンピュータ将棋」を実現するための一プログラムとして記されたことで,当初の目的は一定の成果を挙げた.ここ数年のコンピュータ将棋の発展を概観すると,その原動力が大規模な評価関数の自動調整と計算機速度の上昇によって可能となった網羅的な探索にあったと言える.そのような状況で我々の手法は選択的な探索を指向しており方向を異にしていた感はある.しかしながら本年度の発表に挙げたような人間の熟達度を測る指標としてのn-gram統計の利用を見出したことは,一般人がほとんど太刀打ちできなくなったコンピュータ将棋のこれからの方向性-初心者への教師としてのプログラム形成-を考えていく上で貢献できると考える.また本研究での成果はコンピュータ囲碁の発展に貢献できると考えられる.将棋では名人レベルへの目処がついたが,囲碁(19路)ではいまだアマチュアのレベルである.コンピュータチェス,コンピュータ将棋の歴史を見るといずれもヒューリスティックの効果的な利用がプログラム強化のブレイクスルーとなった時期があり,コンピュータ囲碁ではまさにその時期にあたる.本研究の延長として言語ベースアルゴリズムによる名人レベルのコンピュータ囲碁の実現を今後の課題としたい.
著者
長嶋 淳 橋本 剛 橋本 隼一
雑誌
ゲームプログラミングワークショップ2006論文集
巻号頁・発行日
vol.2006, pp.1-8, 2006-11-10

端攻めを苦手としていることは,改善が必要なコンピュータ将棋の弱点の1つである.本研究では,局面情報から端攻めの可能性を判定し,可能性の高い局面において重点的に端攻めの手を読ませることで,この問題に取り組む.多数の棋譜を分析して得られた条件をもとに将棋プログラムTACOS へ端攻めルーチンを実装し,評価を行なった.その結果,実装前と比較してTACOSは多くの局面で端攻めを行なえるようになった.
著者
松井 利樹 橋本 剛 橋本 隼一 野口 陽来
雑誌
情報処理学会研究報告ゲーム情報学(GI)
巻号頁・発行日
vol.2008, no.59(2008-GI-020), pp.9-15, 2008-06-20

本研究ではボナンザメソッドに進行度を用いた評価関数の学習法を提案する。将棋では一般的に序盤は駒の損得、終盤では寄せの速度が重要と言われており、ゲームの進行に応じて適切な値が変動していると考えられる。しかし、序盤から終盤まで単一な局面評価ではどうしても値が平均化されてしまうので良い値を得られないことがしばしばある。そこで従来の将棋プログラムで使われてきた局面の進行具合を表す変数(進行度)を使って表現し、より精度の高い評価関数を設計した。自己対戦の結果より提案した手法の有効性を確認した。
著者
野口 陽来 松井 利樹 橋本 隼一 橋本 剛
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ゲーム情報学(GI) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.59, pp.31-35, 2008-06-20

現在,コンピュータ囲碁ではモンテカルロ法を用いた探索法が主流となっている.その中でより強いプログラムを作るためにプレイアウトの精度を上げる研究が盛んに行われている.その中でパターンを用いてプレイアウトの精度を高める方法が,その方法を使ったプログラムが大きな大会で優勝したため注目されている.本研究では大きさの異なる二つのパターンを棋譜より抽出し,それらのパターンを使用したプレイアウトの性能を比較した。その結果大きいパターンを使用したプレイアウトの方がパターンを使用しないそれより高い性能を示すことがわかった。またパターンはそれに応じた使い方をしなければ効果が出ないことが予想された。Today, Monte-Carlo method is mainly used in the domain of computer go. There are many studies that improve the accuracy of the Monte-Carlo playout. In this paper, we extract two set of patterns of different size from game records and compare the performances of these patterns. The experimental results show that the bigger patterns have performance better in the playout. Moreover the performance depend on how the patterns are used.