著者
伊藤 昭 金渕 満
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-I, 情報・システム, I-情報処理 (ISSN:09151915)
巻号頁・発行日
vol.84, no.3, pp.285-293, 2001-03-01
被引用文献数
24

強化学習は, 実世界においてエージェントに協調することを学習させるための有望な手法である.しかしながら, 実際的な問題に使おうとすると, 状態数の増加に伴う学習速度の遅さがボトルネックとなる.我々は, 学習の初期の段階では知覚情報を粗視化することで実効的な状態数を削減し, その後に完全知覚に戻すことで長期的にも良い性能を得ることを試みた.しかしながら, 単純に知覚精度を切り換えるだけでは, 初期の「誤った知識」を後から修正することは難しい.そこで, 初期においても, 完全知覚条件と知覚制限条件の二つの学習器を並行して学習させ, 適当なタイミングで切り換えることで, 知覚制限による高速の初期学習, 完全知覚による良好な長期性能を達成する手法を開発した.