著者
高橋 大樹 伊藤 秀昭 澤 繁美 中村 清彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NC, ニューロコンピューティング (ISSN:09135685)
巻号頁・発行日
vol.105, no.658, pp.25-30, 2006-03-16
参考文献数
7

機械学習の一つである強化学習は条件付けのモデルとして提案された計算モデルである。中脳のドーパミン細胞活動が強化学習における時間差分予測誤差を表現しているという報告がされている。また、近年、確率的に報酬が与えられる場合、不確実さを表すドーパミン細胞活動が示された。本研究の目的はこの不確実さの活動を計算モデルを用いて再現する事である。大脳基底核の計算モデルとして強化学習を仮定し、正の時間差分予測誤差より負の時間差分予測誤差を重視して学習を行う事で不確実さを表す活動を再現する事ができることを示す。また、このモデルが人間の行動特性であるプロスペクト理論の一部をも再現できる事を示す。