著者
水上 直紀 中張 遼太郎 浦 晃 三輪 誠 鶴岡 慶雅 近山 隆
雑誌
ゲームプログラミングワークショップ2013論文集
巻号頁・発行日
pp.1-7, 2013-11-01

コンピュータ麻雀プレイヤの研究はあまり行われておらず、実力も平均レベルに届いていない状態である。本研究では4人零和不確定不完全情報ゲームである麻雀の多人数という要素を削除した1人麻雀を考え、1人麻雀と4人麻雀の差を解析し、その差を埋めることで1人麻雀の4人麻雀への適用を図る。解析の結果、4人麻雀と1人麻雀の最も大きな差は降りでことが分かったため、降りるべき局面を機械学習により認識できるようにした。降りを認識したプレイヤを4人麻雀で評価し、降りを認識しないプレイヤより有意に強いことを示した。また得られたプレイヤは平均プレイヤと同等の実力であることを確認した。
著者
水上 直紀 鶴岡 慶雅
雑誌
ゲームプログラミングワークショップ2015論文集
巻号頁・発行日
vol.2015, pp.179-186, 2015-10-30

長期的な戦略に基づく手の決定は繰り返しゲームにおいて重要である.本論文では麻雀の繰り返しゲームの性質に着目して最終順位を考慮したコンピュータ麻雀プレイヤの構築法について述べる.牌譜中に現れた点数状況から最終順位を予測するモデルの学習を行う.モンテカルロ法のシミュレーションでの報酬を予測モデルの結果を用いることで最終順位に基づく手をプログラムは選択する.オンライン麻雀サイト「天鳳」で作成されたプログラムの実力を評価した結果,レーティングとして,中級者を超える1844点が得られた.
著者
鶴岡 慶雅 田浦 健次朗
雑誌
情報処理
巻号頁・発行日
vol.56, no.5, pp.452-455, 2015-04-15

本稿では,コンピュータに関する諸分野を専攻する,いわゆる「情報系」の学科において,どのような数学が教えられているかを概観する.情報系の数学カリキュラムを構成する,解析学(微分・積分),線形代数,確率統計,微分積分,ベクトル解析,フーリエ解析,離散数学,代数学,情報理論,アルゴリズム,形式言語理論,計算量理論,数理論理学,言語モデル論,数値解析,最適化,グラフ理論などについて,情報処理とのかかわりにふれつつ簡単に紹介する.
著者
水上 直紀 鶴岡 慶雅
雑誌
ゲームプログラミングワークショップ2014論文集
巻号頁・発行日
vol.2014, pp.48-55, 2014-10-31

相手の手や見えない状態を予測することは不完全情報ゲームにおいて重要である.本論文では相手のモデルとモンテカルロ法を用いたコンピュータ麻雀プレイヤの構築法について述べる.相手のモデルは三つの要素(聴牌,待ち牌,得点)の組み合わせとし,各要素を個別に牌譜から予測モデルの学習を行う.モンテカルロ法のシミュレーション中の相手の挙動はこれらのモデルによって得られる確率分布に基づく.オンライン麻雀サイト「天鳳」で作成されたプログラムの実力を評価した結果,レーティングとして,中級者と同等である1681点が得られた.
著者
水上 直紀 鶴岡 慶雅
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.81-88, 2016-10-28

本論文では強化学習を用いた麻雀プレイヤを構築する方法について述べる.初めに手牌から和了点数を予測するモデルを生成した牌譜から学習する.このモデルの結果と期待最終順位を用いて効率的な和了を行う手をプログラムは選択する.このモデルの結果と期待最終順位を用いて効率的な和了を行う手をプログラムは選択する.得られたプログラムは高い点数を和了する技術を獲得したものの,自己対戦の結果は元のプログラムに勝ち越すことはできなかった.
著者
亀甲 博貴 森 信介 鶴岡 慶雅
雑誌
ゲームプログラミングワークショップ2014論文集
巻号頁・発行日
vol.2014, pp.202-209, 2014-10-31

本稿では将棋の解説文中に現れる自然言語による指し手表現と実際の将棋の局面との対応付け手法を提案する.手法の説明に先立ち解説木と候補木の概念を導入する.最初にルールベースの手法により,解説文中に現れる合法手から構成される候補木を列挙する.列挙された候補木の中から,コンピュータ将棋プログラムの評価値を用いて解説木を選択する.本稿では提案手法を用いて解説木を生成し,その誤りについて解析した.また得られた解説木を解説文生成手法に適用し,解説文生成を行った.実験の結果,多くの局面において指し手表現と局面状態を対応付けた解説木の獲得に成功し,またそのうち約8割は正しい解説木の獲得に成功していた.また得られた解説木を解説文生成に適用し,複数の有益な解説文の生成に成功した.
著者
亀甲 博貴 森 信介 鶴岡 慶雅
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.28-35, 2016-10-28

本稿では将棋の解説文において示すべき指し手の推定手法を提案する.人間が付与した解説文中に現れる指し手符号と実際のゲームの状態空間との対応付けを行うことによって得られた,解説木という概念によって示された人間による解説文中に現れる指し手を教師として,解説すべき指し手の予測モデルを学習する.また,これによって得られた予測モデルと探索結果を組み合わせることで解説されるべき指し手の予測を行う.指し手の予測モデルは精度の大幅な向上は実現できなかったが,解説文中に現れる指し手は棋譜中の指し手とは異なる性質を持っており,提案手法によってその性質を獲得しうることを示した.またこの予測モデルと探索結果を組み合わせることで一部の解説木の生成が可能であることを示した.
著者
亀甲 博貴 浦 晃 三輪 誠 鶴岡 慶雅 森 信介 近山 隆
雑誌
ゲームプログラミングワークショップ2013論文集
巻号頁・発行日
pp.36-43, 2013-11-01

将棋の対局を観戦する上でコンピュータ将棋プログラムの形勢判断は有益な情報である.自然言語による局面の解説をプログラムが行えるようになれば,より有益な情報を提供できると考えられる.本稿では将棋の解説文を生成するモデルを提案し,その根幹である局面からの特徴語生成について調査した.学習の対象とする文を,意味でクラス分けする分類器を学習しその予測を用いることで限定した.しかし特徴語生成はF 値0.38 と,期待されるほどの精度では行えなかったものの,解説文の生成においては,特定の局面については正しい文を生成できることが分かった.
著者
齋藤 雄太 鶴岡 慶雅
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.196-200, 2016-10-28

事前知識を用いない多人数不完全情報ゲームのAIの学習は、人工知能を現実世界の問題に応用する上で非常に重要な課題の一つである。本研究では、多人数不完全情報ゲームの一種であるトリックテイキングゲームの行動価値観数を線形関数で近似し、Q学習を行った。その結果、トリックテイキングゲームにQ学習を適用することで単純なルールベースのプレイヤに勝る結果が得られること、自己対戦による学習を行うことで、ランダムプレイヤによる学習を行った時よりも学習結果が向上することを示した。
著者
水上 直紀 中張 遼太郎 浦 晃 三輪 誠 鶴岡 慶雅 近山 隆
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.55, no.11, pp.2410-2420, 2014-11-15

本論文では,牌譜を用いた教師付き学習による麻雀プログラムの作成法について述べる.まず,上級者の牌譜を用いたパーセプトロン学習によって1人麻雀プレイヤを作成し,それを拡張することによって4人麻雀への適用を行う.拡張は,1人麻雀プレイヤに「降り」と「鳴き」の機能を教師付き学習によって導入することで行った.オンライン麻雀サイト「天鳳」で作成されたプログラムの実力を評価した結果,レーティングとして,平均的な人間プレイヤーの実力を大きく上回る1,651点が得られた.
著者
李 凌寒 鶴岡 慶雅
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.30, no.2, pp.664-688, 2023 (Released:2023-06-15)
参考文献数
41

本論文では,ニューラルネットエンコーダが学習する知識のうち,どのような構造的知識が自然言語のタスクを解くのに転移可能かを調査する.提案するアプローチでは,自然言語の構造を模したいくつかの「人工言語」を用いてエンコーダを訓練し,そのエンコーダの自然言語の下流タスクにおける性能を評価することで,事前学習データに含まれている構造的知識の転移可能性を計測する.実験の結果,転移可能なエンコーダを獲得するにあたって,事前学習のデータ系列中において,統計的依存関係が重要であること,係り受け関係を持つ際に入れ子構造が有用であることなどが明らかとなった.こうした結果は,エンコーダが転移可能な抽象的な知識として,位置を考慮したトークンの文脈依存性があることを示唆している.
著者
鶴岡 慶雅
雑誌
情報処理
巻号頁・発行日
vol.58, no.2, pp.96-97, 2017-01-15
著者
古居 敬大 浦 晃 三輪 誠 鶴岡 慶雅 近山 隆
雑誌
ゲームプログラミングワークショップ2012論文集
巻号頁・発行日
vol.2012, no.6, pp.211-218, 2012-11-09

3人以上で行われるポーカーのような多人数ゲームにおいて,相手プレイヤの人数が多少変わったとしても有効な戦略の性質は変わらないことが予想される.そこで本稿では相手プレイヤの行動を削減・抽象化を行うことで,多くのプレイヤが存在するゲームで実際のゲームより少ない人数のゲームを想定し,少人数ゲームで学習した戦略を適用する手法を提案する.簡易的な多人数のポーカーでの実験の結果,特に多人数でのゲームで十分に学習ができていない場合は提案手法が有効になり大きな報酬が得られることがわかった.
著者
河村 圭悟 水上 直紀 鶴岡 慶雅
雑誌
ゲームプログラミングワークショップ2016論文集
巻号頁・発行日
vol.2016, pp.188-195, 2016-10-28

不完全情報ゲームにおいて,ナッシュ均衡戦略は非常に重要なテーマである.特に多人数不完全情報ゲームにおいては,ナッシュ均衡解を一般に求める方法はまだ確立されていないことから,多くの関心を集めている.2人テキサス・ホールデムはCFR+ (Tamelin, 2014) によって解かれた (generally weakly solved) が,CFR+は空間計算量の観点から3人以上のテキサス・ホールデムに適用するには問題がある.本研究ではNFSP (Heinrich and Silver, 2016) と呼ばれる手法を用いて,CFR+では解くことが難しい多人数不完全情報ゲームのナッシュ均衡解を求めることを目指す.本研究では,学習部分にソフトマックス回帰を用いたFictitious Self-Play (FSP) を使用して,テキサス・ホールデムのトイゲームである2人クン・ポーカーにおいてFSPが近似的なナッシュ均衡解を求められることを示した.また,多人数ゲームである3人クン・ポーカーにおいても,FSPが近似的なナッシュ均衡解を求められることを示し,CFR+の戦略に対するFSPの戦略の平均被搾取量が減少することを示した.
著者
齋藤 晃介 三輪 誠 鶴岡 慶雅 近山 隆
雑誌
ゲームプログラミングワークショップ2013論文集
巻号頁・発行日
pp.134-137, 2013-11-01

ランダム性を持つゲームでは,プレイヤーが未来に得る情報が確率的に決まる.そのようなゲームの中から,ぷよぷよという落下型パズルゲームに着目する.ぷよぷよは,人間のプレイヤーは将来の完成型を考えて行動を選択しており,また完全にランダムな探索が無駄になりやすいために先読みが難しいゲームである.本論文では,確定完全情報パズルゲームで有効性を示されたNested Monte-Carlo Searchをぷよぷよに適用する手法を提案し,そのアルゴリズムの振る舞いを調査した.その結果,今回の設定では計算時間に見合うだけの有意な性能は示せなかった.
著者
川上 裕生 浦 晃 三輪 誠 鶴岡 慶雅 近山 隆
雑誌
ゲームプログラミングワークショップ2013論文集
巻号頁・発行日
pp.66-72, 2013-11-01

将棋プログラムの評価関数は大量の棋譜を利用した機械学習によって調整する。これにはプロ棋士の棋譜が用いられているが棋譜の数には限りがあり、新たに指し手の教師情報のついた局面を作成するには大きなコストが必要となる。本稿では、教師情報を付けるコストを削減するために、能動学習を用いて学習に有効に働く局面を選択する手法を提案する。既存の棋譜を用いて提案手法の評価を行ったところ、将棋の評価関数の学習に有効な局面が存在し、その選択が可能であることを示した。
著者
鶴岡 慶雅 近山 隆
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.101, no.189, pp.91-97, 2001-07-09

統計的クラス分類器としての決定リストは, 近年自然言語処理における様々な分野でその有効性を示している.決定リストを構成する上で, もっとも重要な問題の一つは, ルールの信頼度の算出法である.しかし決定リストを用いた多くの研究では, 信頼度の算出法についてそれほど注意が払われていない.そこで本論文では, ベイズ学習法を利用してルールの信頼度を算出する手法を示す.さらに, 証拠の種類ごとに異なる事前分布を利用することで, より正確な信頼度の推定が可能になり, 決定リストの性能が向上することを示す.本論文では, 本手法の有効性を確かめるために, 擬似単語の判定問題に関して実験を行った.その結果, 事前分布を用いることにより判定精度の向上と, 判定の信頼度自身の正確さの向上という, 2つの点で効果が見られた.