著者
伊藤 昭 金渕 満
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-I, 情報・システム, I-情報処理 (ISSN:09151915)
巻号頁・発行日
vol.84, no.3, pp.285-293, 2001-03-01
被引用文献数
24

強化学習は, 実世界においてエージェントに協調することを学習させるための有望な手法である.しかしながら, 実際的な問題に使おうとすると, 状態数の増加に伴う学習速度の遅さがボトルネックとなる.我々は, 学習の初期の段階では知覚情報を粗視化することで実効的な状態数を削減し, その後に完全知覚に戻すことで長期的にも良い性能を得ることを試みた.しかしながら, 単純に知覚精度を切り換えるだけでは, 初期の「誤った知識」を後から修正することは難しい.そこで, 初期においても, 完全知覚条件と知覚制限条件の二つの学習器を並行して学習させ, 適当なタイミングで切り換えることで, 知覚制限による高速の初期学習, 完全知覚による良好な長期性能を達成する手法を開発した.

言及状況

はてなブックマーク (1 users, 1 posts)

Twitter (3 users, 16 posts, 2 favorites)

「ゲーム 学習」でヒットしたのはこんな論文です!知覚情報の粗視化によるマルチエージェント強化学習の高速化 : ハンターゲームを例に…(伊藤ら) http://t.co/2XxTIM1uOH
「ゲーム 学習」でヒットしたのはこんな論文です!知覚情報の粗視化によるマルチエージェント強化学習の高速化 : ハンターゲームを例に…(伊藤ら) http://t.co/2XxTIM1uOH
「ゲーム 学習」でヒットしたのはこんな論文です!知覚情報の粗視化によるマルチエージェント強化学習の高速化 : ハンターゲームを例に…(伊藤ら) http://t.co/2XxTIM1uOH
「ゲーム 学習」でヒットしたのはこんな論文です!知覚情報の粗視化によるマルチエージェント強化学習の高速化 : ハンターゲームを例に…(伊藤ら) http://t.co/2XxTIM1uOH
「ゲーム 学習」でヒットしたのはこんな論文です!知覚情報の粗視化によるマルチエージェント強化学習の高速化 : ハンターゲームを例に…(伊藤ら) http://t.co/2XxTIM1uOH
「ゲーム 学習」でヒットしたのはこんな論文です!知覚情報の粗視化によるマルチエージェント強化学習の高速化 : ハンターゲームを例に…(伊藤ら) http://t.co/2XxTIM1uOH
「ゲーム 学習」でヒットしたのはこんな論文です!知覚情報の粗視化によるマルチエージェント強化学習の高速化 : ハンターゲームを例に…(伊藤ら) http://t.co/2XxTIM1uOH
「ゲーム 学習」でヒットしたのはこんな論文です!知覚情報の粗視化によるマルチエージェント強化学習の�…(伊藤ら) http://t.co/2XxTIM1uOH
「ゲーム 学習」でヒットしたのはこんな論文です!知覚情報の粗視化によるマルチエージェント強化学習の高速化 : ハンターゲームを例に(伊藤ら) http://t.co/2XxTIM1uOH
めもQT @ronbuntter: こんな論文どうですか? 知覚情報の粗視化によるマルチエージェント強化学習の高速化 : ハンターゲームを例に(伊藤 昭ほか),2001 http://t.co/hV0vIRsu
こんな論文どうですか? 知覚情報の粗視化によるマルチエージェント強化学習の高速化 : ハンターゲームを例に(伊藤 昭ほか),2001 http://t.co/gznwHmv4
こんな論文どうですか? 知覚情報の粗視化によるマルチエージェント強化学習の高速化 : ハンターゲームを例に(伊藤 昭ほか),2001 http://t.co/gznwHmv4
こんな論文どうですか? 知覚情報の粗視化によるマルチエージェント強化学習の高速化 : ハンターゲームを例に(伊藤昭ほか),2001 http://id.CiNii.jp/NWdfL
こんな論文どうですか? 知覚情報の粗視化によるマルチエージェント強化学習の高速化 : ハンターゲームを例に(伊藤昭ほか),2001 http://id.CiNii.jp/NWdfL
こんな論文どうですか? 知覚情報の粗視化によるマルチエージェント強化学習の高速化 : ハンターゲームを例に(伊藤昭ほか),2001 http://id.CiNii.jp/NWdfL
こんな論文どうですか? 知覚情報の粗視化によるマルチエージェント強化学習の高速化 : ハンターゲームを例に,2001 http://ci.nii.ac.jp/naid/110003184661 強化学習は, 実世界においてエージェントに協調することを学習させるための有望な手法であ

収集済み URL リスト