- 著者
-
諸岡 健一
浜元 和久
長橋 宏
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
- 巻号頁・発行日
- vol.88, no.7, pp.1269-1277, 2005-07-01
- 被引用文献数
-
7
実環境でロボットが適応的に行動するには, 他者動作の認識機能と, 自己動作の生成機能が必要である.我々は, 現在, 他者動作認識モジュールと自己動作生成モジュールからなるシステムを開発中であり, 本論文では, 自己動作に基づく他者動作認識に焦点を当てる.認識及び生成モジュールは, それぞれ隠れマルコフモデル(HMM)と強化学習によって構築される.このとき, HMMの推定では, 一般に, 多数の学習用データが必要であるが, 実世界で十分な数の動作データを取得できる保証はなく, したがって, HMMの精度が低下する可能性がある.そこで, 本論文では, 強化学習の学習結果に基づくHMMの新たな推定法について述べる.強化学習の状態価値関数をいくつかのクラスタに離散化し, 各クラスタをHMMの各状態と対応づける.これにより, 価値関数値に基づいてHMMの出力分布を推定し, HMMの精度の向上が可能となる.実験により, 提案手法によるHMMは, 学習データが少数の場合でも, 認識精度の低下を抑えることができることを確認した.