著者
馬野 元秀 阪口 和馬 立野 宏樹
出版者
日本知能情報ファジィ学会
雑誌
日本知能情報ファジィ学会 ファジィ システム シンポジウム 講演論文集
巻号頁・発行日
vol.30, pp.556-561, 2014

カーレースゲームとは、IEEE 2007 Car Racing Competition のコンピュータプログラム同士の対戦ゲームで、2台のカーエージェントが2次元平面上に置かれた目標を目指しながら得点を競うものである。通常、現在の目標を少ないステップ数で通過することが重要であるが、自分が相手より明らかに有利な場合、次の目標が前方にあるように現在の目標を通過する方が重要だと考えられる。このような2つの性質が異なる行動を学習するために、単独走行のカーレースゲームにファジィQ学習を適用し、1つのQ表を2種類の報酬で更新したが、報酬を獲得しやすい行動のQ値がカーエージェントの行動に大きく影響してしまった。そこで、我々は2種類の報酬に応じて2つのQ表を用いるファジィQ学習を提案する。これは、2つのQ表を用いて行動を決定し、2つのQ表を2種類の報酬に応じて更新する。この方法でのシミュレーションの結果を示す。