著者
諸岡 健一 浜元 和久 長橋 宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.88, no.7, pp.1269-1277, 2005-07-01
被引用文献数
7

実環境でロボットが適応的に行動するには, 他者動作の認識機能と, 自己動作の生成機能が必要である.我々は, 現在, 他者動作認識モジュールと自己動作生成モジュールからなるシステムを開発中であり, 本論文では, 自己動作に基づく他者動作認識に焦点を当てる.認識及び生成モジュールは, それぞれ隠れマルコフモデル(HMM)と強化学習によって構築される.このとき, HMMの推定では, 一般に, 多数の学習用データが必要であるが, 実世界で十分な数の動作データを取得できる保証はなく, したがって, HMMの精度が低下する可能性がある.そこで, 本論文では, 強化学習の学習結果に基づくHMMの新たな推定法について述べる.強化学習の状態価値関数をいくつかのクラスタに離散化し, 各クラスタをHMMの各状態と対応づける.これにより, 価値関数値に基づいてHMMの出力分布を推定し, HMMの精度の向上が可能となる.実験により, 提案手法によるHMMは, 学習データが少数の場合でも, 認識精度の低下を抑えることができることを確認した.