著者
西村友伸 大用庫智 高橋達二
雑誌
第75回全国大会講演論文集
巻号頁・発行日
vol.2013, no.1, pp.101-102, 2013-03-06

本研究では人間認知の適応的特性の大規模コンピューティングへの適用例として、ヒトの認知バイアス(対称性・相互排他性)を持つ行動価値関数、 Kohno & Takahashi (2012) が提案したLSVR (loosely symmetric model with variable reference) モデルを用い、モンテカルロ木探索の評価値として実装し、囲碁AIでのゲーム木探索を通して効果を確認した。同様の行動価値関数としては期待損失の限界に保証を持つUCB1が有名だが、LSVRがUCB1と比較して、サンプリング回数が少ない時、また探索の幅が非常に広い時に、より良い性能をもたらすことを示す。更に、LSVRとUCB1の両者を使い分けるハイブリッドモデルについても検証し、その効果も確認した。
著者
西村 友伸 大用 庫智 高橋 達二
雑誌
ゲームプログラミングワークショップ2012論文集
巻号頁・発行日
vol.2012, no.6, pp.191-196, 2012-11-09

本研究では甲野により提案された可変参照型緩対称推論をモンテカルロ木探索に応用させ,その効果を測る為にリバーシのAI に実装し,モンテカルロ木探索で広く利用されているUCT を実装したAI と対戦させた.その結果ある程度のプレイアウトの上ではUCT に勝ち越し,可変参照が木探索においても有効に作用することが分かった.