文献一覧: 岡田雅司 (著者)

6 0 0 0 世界モデルと予測学習によるロボット制御

著者: 谷口忠大岡田雅司前山功伊奥村亮黄瀬輝
出版者: 一般社団法人日本ロボット学会
雑誌: 日本ロボット学会誌 (ISSN:02891824)
巻号頁・発行日: vol.40, no.9, pp.790-795, 2022 (Released:2022-11-18)
参考文献数: 47

2023-06-08 16:36:20
6 + 6 Twitter

1 0 0 0 OA DreamingV2: 再構成不要な離散状態世界モデル学習と強化学習

著者: 岡田雅司谷口忠大
出版者: 一般社団法人人工知能学会
雑誌: 人工知能学会全国大会論文集第36回 (2022) (ISSN:27587347)
巻号頁・発行日: pp.2M1OS19a01, 2022 (Released:2022-07-11)

本稿では、世界モデルに基づく強化学習であるDreamerV2とDreamingを拡張したDreamingV2を提案する。DreamerV2は潜在状態をカテゴリ変数で表現する離散世界モデルを用いた強化学習手法である。またDreamingは、対照学習により、一般的な世界モデル学習におけるオートエンコーディング(再構成)の過程を用いない強化学習手法である。提案するDreamingV2は、DreamingV2の離散状態表現とDreamingの再構成不要な世界モデル学習の両者を採用した手法である。5つのロボットアームのタスクのシミュレーション実験において、DreamingV2はDreamerV2および最新の世界モデルを上回る性能を達成した。DreamingV2は実世界の不連続的なダイナミクスを離散表現で適切に表現でき、また実世界の複雑な画像観測の再構成を不要とすることから、DreamingV2はロボット強化学習の有効な手段であると考えられる。

2023-05-07 09:02:06
1 + 5 Twitter

1 0 0 0 OA オーエンス・ルイス : アンビエント環境制御を用いた知的オフィスチェアの提案(<特集>アンビエントインテリジェンス技術とその応用)

著者: 清川清畠中理英細田一史岡田雅司繁田浩功石原靖哲大下福仁角川裕次栗原聡森山甲一
出版者: システム制御情報学会
雑誌: システム/制御/情報 : システム制御情報学会誌 (ISSN:09161600)
巻号頁・発行日: vol.56, no.1, pp.14-20, 2012-01-15
被引用文献数: 1

2013-01-29 17:12:33
1 + 0 Twitter

https://ci.nii.ac.jp/naid/110008898246