著者
市瀬 龍太郎 シャピロ ダニエル ラングリー パット
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-I, 情報・システム, I-情報処理 (ISSN:09151915)
巻号頁・発行日
vol.87, no.6, pp.730-740, 2004-06-01

本論文では,エージェントが他のエージェントの行動を観察することによって,行動制御プログラムを学習する問題について取り扱う.特に,他のエージェントの観察から行動を説明し,そのエージェントの行動を再現できるような,階層的でリアクティブなプログラムをどのように学習するかについて述べる.本論文で観察する行動とは,複数のエージェント間で共有されている複数の選択肢をもつ行動である.本論文で提案する学習手法は,三つの段階を経てプログラムを構成する.最初に,順序性のないプロダクション規則を学習する.次に,それらの規則を分類階層として結合する.最後に,この分類階層を階層的でリアクティブなプログラムに変換する.この手法を使うと,結果として簡潔で分かりやすいプログラムを学習できる.