Ceek.jp Altmetrics (α ver.)
文献ランキング
合計
1ヶ月間
1週間
1日間
文献カレンダー
新着文献
すべて
2 Users
5 Users
10 Users
新着投稿
Yahoo!知恵袋
レファレンス協同データベース
教えて!goo
はてなブックマーク
OKWave
Twitter
Wikipedia
検索
ウェブ検索
ニュース検索
ホーム
文献一覧: 森村 哲郎 (著者)
3件
7
0
0
0
OA
《第11回》リスク考慮型強化学習
著者
森村 哲郎
出版者
公益社団法人 計測自動制御学会
雑誌
計測と制御
(
ISSN:04534662
)
巻号頁・発行日
vol.52, no.9, pp.818-823, 2013 (Released:2018-04-25)
参考文献数
36
1
0
0
0
分布Bellman方程式における動的計画法の収束性解析
著者
森村 哲郎
杉山 将
鹿島 久嗣
八谷大岳
田中 利幸
Morimura Tetsuro
Sugiyama Masashi
Kashima Hisashi
Hachiya Hirotaka
Tanaka Toshiyuki
雑誌
【C】平成22年電気学会電子・情報・システム部門大会講演論文集
巻号頁・発行日
pp.178-183, 2010-09-02
近年、分布Bellman方程式に基づくリターン(積算報酬)分布近似手法が提案され、リスク考慮型強化学習法としての有用性も示された。しかしながら、その収束性に関する解析は十分でない。そこで本報告では、動的計画法により分布Bellman方程式を解いた場合の収束性解析結果を記す。動的計画法により、リターンの初期近似分布に依存せず真のリターン分布に収束することや、真の分布のモーメントに収束する速度について報告する。
1
0
0
0
方策勾配に基づく効率の良い課題非依存な強化学習法(創発システム,<特集>人工知能分野における博士論文)
著者
森村 哲郎
出版者
社団法人人工知能学会
雑誌
人工知能学会誌
(
ISSN:09128085
)
巻号頁・発行日
vol.24, no.1, 2009-01-01