文献一覧: 田渕一真 (著者)

2 0 0 0 OA 模倣学習と強化学習の調和による効率的行動獲得

著者: 田渕一真谷口忠大椹木哲夫
出版者: 一般社団法人人工知能学会
雑誌: 人工知能学会全国大会論文集第20回全国大会(2006)
巻号頁・発行日: pp.212, 2006 (Released:2006-12-07)

強化学習を行う際,学習者は事前知識を持たなければ膨大な学習時間を費やさねばならない.これに対し,人間は他者の行動を,それが必ずしも最適な行動とは言えない場合でも模倣することにより探索時間を効率的に低減していると考えられる.本研究では機械学習の研究において,従来別々の問題として考えられて来た模倣学習と強化学習を,自然な形で融合させる学習手法を提案する.

2018-02-21 22:14:09
2 + 12 Twitter

https://www.jstage.jst.go.jp/article/pjsai/JSAI06/0/JSAI06_0_212/_article/-char/ja/
(info:doi/10.11517/pjsai.JSAI06.0.212.0)