著者
榎本 一紀 松本 直幸 木村 實
出版者
日本生物学的精神医学会
雑誌
日本生物学的精神医学会誌 (ISSN:21866619)
巻号頁・発行日
vol.24, no.2, pp.89-94, 2013 (Released:2017-02-16)
参考文献数
12

絶え間なく変化する自然環境のなかで,雑多な情報から必要なものを判別し,過去の経験や現在の状況に照らし合わせて,将来の目標を見据えた最善手を打つことは,人間やその他の動物にとって,配偶者や食料,金銭などの報酬を効率よく得るために,また,危険や損失を回避するために必須である。ドパミン細胞は中脳の黒質緻密部,腹側被蓋野などに集中して存在し,線条体や前頭葉,大脳辺縁系などの広範な脳領域に投射しており,報酬を得るための意思決定や行動選択に関わる神経システムにおいて,重要な役割を担っている。過去の研究から,ドパミン細胞の活動は,刺激の新規性や,動機づけレベルなどと同時に,報酬価値情報を反映することが報告されている。ドパミン細胞は条件刺激に対して放電応答を示して,期待される報酬の価値を表現し,また,強化因子に対する応答は報酬の予測誤差を表現する。最近,筆者らはニホンザルを用いた研究によって,ドパミン細胞の活動が,学習によって,長期的な将来報酬の価値を表現することを明らかにした。この研究では,サルに複数回の報酬獲得試行を経てゴールに到達することを目標とする行動課題を学習させ,課題遂行中のドパミン細胞の活動を電極記録した。ドパミン細胞は,条件刺激(各試行の開始の合図となる視覚刺激)と,正または負の強化因子(報酬獲得の有無を指示する音刺激)に対して応答し,その応答の大きさは,目前の1試行だけの報酬価値ではなく,目標到達までの,複数回の報酬価値を表現していた。これらの活動は,強化学習理論に基づく一般的な学習モデルによって推定した報酬予測誤差(TD誤差)によってよく説明できた。また,このような報酬価値の表現は課題の学習初期には見られず,課題の構造に習熟してはじめて観測できることが確かめられた。以上のことから,ドパミン細胞は長期的な将来報酬の情報を線条体や前頭前野などに送ることで,意思決定や行動選択を制御していると考えられる。この結果は,目先の利益にとらわれず,目標に向かって意志決定や行動選択を行う脳の作動原理解明につながることが期待される。
著者
榎本 一紀 松本 直幸 木村 實
出版者
日本生物学的精神医学会
雑誌
日本生物学的精神医学会誌 (ISSN:21866619)
巻号頁・発行日
vol.24, no.2, pp.89-94, 2013

絶え間なく変化する自然環境のなかで,雑多な情報から必要なものを判別し,過去の経験や現在の状況に照らし合わせて,将来の目標を見据えた最善手を打つことは,人間やその他の動物にとって,配偶者や食料,金銭などの報酬を効率よく得るために,また,危険や損失を回避するために必須である。ドパミン細胞は中脳の黒質緻密部,腹側被蓋野などに集中して存在し,線条体や前頭葉,大脳辺縁系などの広範な脳領域に投射しており,報酬を得るための意思決定や行動選択に関わる神経システムにおいて,重要な役割を担っている。過去の研究から,ドパミン細胞の活動は,刺激の新規性や,動機づけレベルなどと同時に,報酬価値情報を反映することが報告されている。ドパミン細胞は条件刺激に対して放電応答を示して,期待される報酬の価値を表現し,また,強化因子に対する応答は報酬の予測誤差を表現する。最近,筆者らはニホンザルを用いた研究によって,ドパミン細胞の活動が,学習によって,長期的な将来報酬の価値を表現することを明らかにした。この研究では,サルに複数回の報酬獲得試行を経てゴールに到達することを目標とする行動課題を学習させ,課題遂行中のドパミン細胞の活動を電極記録した。ドパミン細胞は,条件刺激(各試行の開始の合図となる視覚刺激)と,正または負の強化因子(報酬獲得の有無を指示する音刺激)に対して応答し,その応答の大きさは,目前の1試行だけの報酬価値ではなく,目標到達までの,複数回の報酬価値を表現していた。これらの活動は,強化学習理論に基づく一般的な学習モデルによって推定した報酬予測誤差(TD誤差)によってよく説明できた。また,このような報酬価値の表現は課題の学習初期には見られず,課題の構造に習熟してはじめて観測できることが確かめられた。以上のことから,ドパミン細胞は長期的な将来報酬の情報を線条体や前頭前野などに送ることで,意思決定や行動選択を制御していると考えられる。この結果は,目先の利益にとらわれず,目標に向かって意志決定や行動選択を行う脳の作動原理解明につながることが期待される。
著者
木村 實 松本 直幸
出版者
玉川大学
雑誌
基盤研究(A)
巻号頁・発行日
2008

ドーパミン細胞が長期的な報酬予測を表現するかどうかを調べた。3択によって3回の報酬を得る課題を日本ザルに行わせた。予測的な舌の運動から、動物は各試行での報酬価値ではなく、長期的報酬(強化学習の価値関数)を予測していることが判明した。ドーパミン細胞は、動物の行動と同様に長期的報酬予測を表現することが分かった。将来のゴールに向けて長期的な予測と誤差を表現し、線条体などの標的部位での価値のアップデートや意志決定に必須の役割を担うと考えられる。