著者
鮫島 和行 銅谷 賢治
出版者
バイオメカニズム学会
雑誌
バイオメカニズム学会誌 (ISSN:02850885)
巻号頁・発行日
vol.25, no.4, pp.167-171, 2001-11-01 (Released:2016-11-01)
参考文献数
10
被引用文献数
1 1

大脳基底核は大脳皮質と脳幹の間に位置する一連の神経核の集まりの総称である.大脳基底核はその障害によって運動機能の異常が生じることから運動の実行や計画にかかわり,また報酬に依存する神経活動から,目的指向行動を形成するための重要な役割を担うと考えられている.しかし,複雑に絡み合った核群の機能的役割はまだ謎のままである.本解説では,まず報酬をもとにした学習の枠組みである「強化学習」について解説し,次にこれまで調べられてきた大脳基底核にかかわる電気生理学,解剖学からの知見を紹介する.さらにこれらをもとに,我々が提案している大脳基底核の強化学習モデルについて解説する.
著者
宮崎 勝彦 宮崎 佳代子 銅谷 賢治
出版者
日本生物学的精神医学会
雑誌
日本生物学的精神医学会誌 (ISSN:21866619)
巻号頁・発行日
vol.24, no.2, pp.95-100, 2013 (Released:2017-02-16)
参考文献数
28

セロトニン神経系による予測と意思決定の制御機能の1つとして衝動性との関わりが考えられる。これまでの研究から,中枢セロトニン神経系は将来起こりうる罰・嫌悪の予測に基づいて動物の行動を抑制することに関与することが示されている。行動抑制の障害は衝動性の亢進を引き起こすと考えられる。しかしながら,これまでの研究からセロトニンの関与が示された衝動性の中には,セロトニンの嫌悪刺激に基づく行動抑制としての働きで説明が困難なものも存在する。我々のグループはラットを用いた実験から,遅延報酬を獲得するための待機行動にはセロトニン神経活動の活性化が必要であることを見出した。我々は報酬獲得の目的のために辛抱強く待つことを「報酬予期に基づく待機行動」と定義し,セロトニン神経は「報酬予期に基づく待機行動」と「嫌悪予測に基づく行動抑制」の両方に関与しているという仮説を提案する。
著者
森本 淳 銅谷 賢治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.82, no.11, pp.2118-2131, 1999-11-25
被引用文献数
42

人間のように多自由度の身体をもつロボットが,試行錯誤的に目的とする運動を獲得することは,ロボット学習の分野において大きな課題である.本論文では強化学習を用いて,ロボットが高次元状態空間中における運動学習を行うための手法,主に評価関数の近似方法についての考察を行う.制御タスクとしては,人間の身体の形を単純化した3リンク2関節ロボットの起き上がり運動を扱う.強化学習の一手法である,連続時間,連続状態のTemporal Difference学習則を,正規化ガウス関数を必要に応じて逐次配置する関数近似手法と組み合わせ,高次元連続状態空間中での起き上がり運動学習を行った.その結果,シミュレーション上で約2400回の試行後に起き上がり運動が獲得された.
著者
谷口 忠大 山川 宏 長井 隆行 銅谷 賢治 坂上 雅道 鈴木 雅大 中村 友昭 谷口 彰
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第36回 (2022)
巻号頁・発行日
pp.2M6OS19d04, 2022 (Released:2022-07-11)

本発表では著者らが提案し推進する全脳確率的生成モデル(WB-PGM: Whole-Brain Probabilistic Generative Model)のアプローチとその展望について概説する。世界モデルはセンサ・モータ情報を行動主体の主観的な視点からコーディングする予測モデルである。マルチモーダルな情報を統合し、複雑な身体を統御し、環境に適応できる人間の知能、および発達的なロボットの構成をその延長線上で捉えようとすると、その認知アーキテクチャとしての構造を検討する必要が現れる。WB-PGMは、人間の全能の構造に学ぶとともに、予測学習を基礎に据えた確率的生成モデルにより認知アーキテクチャを構築しようというアプローチである。本発表ではその基本的な考え方と展望に関しての報告する。
著者
銅谷 賢治
出版者
日本神経回路学会
雑誌
日本神経回路学会誌 (ISSN:1340766X)
巻号頁・発行日
vol.9, no.1, pp.36-40, 2002-03-05 (Released:2011-02-21)
参考文献数
7
被引用文献数
1

この講義では, 進化/発達/学習/修飾というテーマに関連し, 脳の学習の機能分担アーキテクチャと適応戦略についての仮説, また, 神経修飾物質系の学習における機能モデルについて紹介する.
著者
鮫島 和行 片桐 憲一 銅谷 賢治 川人 光男
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.9, pp.2092-2106, 2001-09-01
被引用文献数
17

本研究では, 複数の予測モデルを用いた強化学習方式(MMRL)を提案する.MMRLでは, 制御対象の将来の状態を予測する予測モデルと, 制御出力を学習する強化学習コントローラを組としたモジュールが複数用意され, 各予測モデルの予測誤差のsoftmax関数により予測の正確なモジュールほど大きい値をもつ「責任信号」が算出される.各モジュールの学習と制御出力を責任信号によって重みづけることにより異なる状況に対応したモジュールが形成される.MMRLでのモジュール数や担当領域などの事前知識なしにロバストなモジュール化を実現するために, 空間・時間的な連続性の仮定による事前責任信号の定式化する.また, MMRLの効率的な実装法として複数の線形予測・2次報酬モデルによる最適コントローラ(MLQC)の定式化を行う.MLQCの性能の確認を行うため単振子を用いた振上げのシミュレーションを行う.単振子のつり下がり付近と倒立点付近の局所線形予測モデルとそれに対応するコントローラが学習により獲得され, 従来手法よりも高速にタスクが学習可能であり, またモジュールの冗長性にも対応可能なことを示す.
著者
磯村 拓哉 銅谷 賢治 小松 三佐子 蝦名 鉄平
出版者
国立研究開発法人理化学研究所
雑誌
学術変革領域研究(A)
巻号頁・発行日
2023-04-01

脳の計算原理を解明し人工知能に実装することは自然科学最大のフロンティアである。脳はどのように外界の生成モデルを獲得し予測や行動を実現しているのだろうか?本領域の目的は、最先端の計測技術を用いて様々な動物の脳から神経細胞の活動を高精度・大規模に取得し、データから生成モデルをリバースエンジニアリングすることで、脳の統一理論を構築・検証し、その神経基盤を解明することである。そのために神経科学と情報工学の融合領域を創成する。
著者
銅谷 賢治
出版者
日本神経回路学会
雑誌
日本神経回路学会誌 (ISSN:1340766X)
巻号頁・発行日
vol.14, no.4, pp.265, 2007-12-05 (Released:2010-11-12)
著者
佐藤尚 内部 英治 銅谷 賢治
雑誌
情報処理学会論文誌数理モデル化と応用(TOM) (ISSN:18827780)
巻号頁・発行日
vol.48, no.SIG19(TOM19), pp.55-67, 2007-12-15

コミュニケーションの原型は,個体が環境や他の個体との相互作用において,報酬の獲得や適応度の向上に寄与する形で発現したと考えられる.本研究では,報酬最大化を目的とする強化学習エージェントが,余剰な行動と感覚の自由度をコミュニケーショのために使うことを学習できるための条件を,2個体が互いに相手の縄張りに入ると報酬を得るが衝突すると罰を受けるというゲームにより検証した.このゲームでは,コミュニケーションと協調行動のそれぞれが必須ではないが,発光行動を使えるエージェント間では,互いにその光を信号として利用することで衝突を避け,報酬を獲得し合う協調行動の創発が観察された.信号の表現の仕方には多様性が見られ,また作業記憶を持つエージェント間では,信号を送る側とそれに従う側という役割分化も見られた.これは,コミュニケーションと協調行動が必須ではない状況において,意味と信号の任意の対応付けによるコミュニケーションが,コミュニケーションの達成そのものを目的としなくても一般的な行動学習の枠組みにより創発しうることを示す初めての知見である.
著者
内部 英治 銅谷 賢治
出版者
日本神経回路学会
雑誌
日本神経回路学会誌 (ISSN:1340766X)
巻号頁・発行日
vol.14, no.4, pp.293-304, 2007-12-05 (Released:2008-11-21)
参考文献数
57
被引用文献数
1

近年の人工ニューラルネットや機械学習の発展により, 学習能力を持った様々なロボットや人工エージェントなどが開発されている. しかしロボットに目的の行動をうまく学習させるためには (1) メタパラメータ, (2) 報酬関数, (3) 状態表現, (4) 学習アルゴリズムの選択, といった問題を注意深く設計しなければならない. 多くの人工システムでは, それらは設計者が試行錯誤を通して設定していたが, 人間やそれ以外の動物は多様に変化する環境下でも新しい行動を次々と学習している. このようなメタな学習を実現している計算理論とは何かを解明することがサイバーローデントプロジェクトの目的である. 本稿では我々の研究を中心として, 上記4つの問題を自律的に調整・獲得するための手法について概説する.
著者
吉田光佑 清水優 吉本潤一郎 土岐茂 高村真広 岡本泰昌 山脇成人 銅谷賢治
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2013-BIO-34, no.4, pp.1-2, 2013-06-20

うつ病の診断及び治療等において従来の経験に頼った手法ではなく、機能的核磁気共鳴 (fMRI) 技術を用いる研究が盛んに行われている。本研究では、言語流暢性課題におけるうつ病患者の fMRI データを対象に、L1 正則化付きロジスティック回帰を用いることで、より精度の高い客観的診断および関わりのある脳領域の特定を行った。
著者
松本 有央 岡田 真人 銅谷 賢治 菅生 康子 山根 茂 河野 憲二
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NC, ニューロコンピューティング (ISSN:09135685)
巻号頁・発行日
vol.100, no.686, pp.93-100, 2001-03-14

サル側頭葉に存在する顔細胞集団の活動パターンから視覚刺激画像の階層的な構造を抽出できるかどうかを検証するために, Sugaseらの実験データを解析した. 45個のニューロンの活動から38枚の刺激画像に対する38個の応答ベクトルを生成し, そのベクトルをVariational Bayes (VB)アルゴリズムを用いた混合正規分布解析でクラスタリングした. その結果, 異なった画像に対応するニューロン集団を表すベクトルは, 応答の開始時(90-140ms)において"顔か単純図形"などの大分類情報に対応する3つのクラスターを形成した. それに遅れて(140-190ms)それぞれのクラスターは分離し, "人の個体分類"などの詳細な分類情報に対応するサブクラスターを形成することを発見した. さらに相互情報量を計算することでニューロン集団はヒトは個体, サルは表情, 図形は形によって詳細なクラスターが形成されていることが分かった.