著者
本田 直樹
出版者
京都大学
雑誌
若手研究(B)
巻号頁・発行日
2016-04-01

動物は状況に応じて、より多くの報酬が期待できる行動戦略を獲得することで、環境に適応する。しかしながら、自由行動下の動物が持つ行動戦略を定量化する手法は確立していなかった。そこで本研究では、動物の行動時系列データの背後にある行動戦略を価値関数として推定する逆強化学習法を考案した。そして、線虫の温度走性行動へと適用することで、線虫が持つ行動戦略を明らかにすることに成功した。本手法は神経活動とその表現形である行動戦略をつなぐ基盤技術を提供するもので、今後、動物の行動戦略を司る神経メカニズムの解明に大きく貢献することが期待される。

言及状況

Twitter (1 users, 1 posts, 0 favorites)

https://t.co/0bAbHuTFOz 逆強化学習を用いてできる営業の評価関数を求めるとかおもろそうなんだけどねー

収集済み URL リスト