文献一覧: 松野陽一郎 (著者)

1 0 0 0 OA 360°ライブストリーミングとVR・拡張現実技術を用いた多拠点間の遠隔実験指導法の実装

著者: 石岡準也柴山環樹安中英邦松野陽一郎
雑誌: 2020年第81回応用物理学会秋季学術講演会
巻号頁・発行日: 2020-07-09

2022-03-11 03:40:42
1 + 0 Twitter

https://confit.atlas.jp/guide/event/jsap2020a/subject/10a-Z22-8/detail

1 0 0 0 360°ライブストリーミングとVR・拡張現実技術を用いた多拠点間の遠隔実験指導法の実装

著者: 石岡準也柴山環樹安中英邦松野陽一郎
雑誌: 2020年第81回応用物理学会秋季学術講演会(プログラム閲覧サイト)
巻号頁・発行日: 2020-08-21

2020-10-04 10:04:06
1 + 2 Twitter

https://confit.atlas.jp/guide/event/jsap2020a2/subject/10a-Z22-8/detail

1 0 0 0 相手学習に基づくマルチエージェントゲームの強化学習

著者: 松野陽一郎山崎達也松田潤石井信
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. NC, ニューロコンピューティング (ISSN:09135685)
巻号頁・発行日: vol.100, no.688, pp.91-98, 2001-03-16

本研究では, マルチエージェント競合系の例としてカードゲームであるハーツを取り上げ, Actor-Cmicアルゴリズムと先読みを用いた強化学習法を提案する. この系では, 部分観測マルコフ決定過程における強化学習を取り扱わねばならない. 提案手法では, ゲームを序盤, 中盤, 終盤の3つの局面に分割し, それぞれの局面でActorを切り換えて行動制御と学習を行う. 中盤においては, 期待TD誤差に基づく先読みを用いた行動選択を行う. この際, Criticによって近似された状態評価関数と相手戦略から推定した状態遷移確率を用いて期待TD誤差を計算することで部分観測性に対処する. 本手法の有効性を計算機シミュレーション実験により確認した.

2009-06-06 12:41:05
1 はてなブックマーク

https://ci.nii.ac.jp/naid/110003233872