著者
小林 由弥 鈴木 雅大 松尾 豊
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.37, no.2, pp.I-L75_1-17, 2022-03-01 (Released:2022-03-01)
参考文献数
63

Ability to understand surrounding environment based on its components, namely objects, is one of the most important cognitive ability for intelligent agents. Human beings are able to decompose sensory input, i.e. visual stimulation, into some components based on its meaning or relationships between entities, and are able to recognize those components as “object ”. It is often said that this kind of compositional recognition ability is essential for resolving so called Binding Problem, and thus important for many tasks such as planning, decision making and reasoning. Recently, researches about obtaining object level representation in unsupervised manner using deep generative models have been gaining much attention, and they are called ”Scene Interpretation models”. Scene Interpretation models are able to decompose input scenes into symbolic entities such as objects, and represent them in a compositional way. The objective of our research is to point out the weakness of existing scene interpretation methods and propose some methods to improve them. Scene Interpretation models are trained in fully-unsupervised manner in contrast to latest methods in computer vision which are based on massive labeled data. Due to this problem setting, scene interpretation models lack inductive biases to recognize objects. Therefore, the application of these models are restricted to relatively simple toy datasets. It is widely known that introducing inductive biases to machine learning models is sometimes very useful like convolutional neural networks, but how to introduce them via training depends on the models and is not always obvious. In this research, we propose to incorporate self-supervised learning to scene interpretation models for introducing additional inductive bias to the models, and we also propose a model architecture using Transformer which is considered to be suitable for scene interpretation when combined with self-supervised learning. We show proposed methods outperforms previous methods, and is able to adopt to Multi-MNIST dataset which previous methods could not deal with well.
著者
谷口 忠大 山川 宏 長井 隆行 銅谷 賢治 坂上 雅道 鈴木 雅大 中村 友昭 谷口 彰
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第36回 (2022)
巻号頁・発行日
pp.2M6OS19d04, 2022 (Released:2022-07-11)

本発表では著者らが提案し推進する全脳確率的生成モデル(WB-PGM: Whole-Brain Probabilistic Generative Model)のアプローチとその展望について概説する。世界モデルはセンサ・モータ情報を行動主体の主観的な視点からコーディングする予測モデルである。マルチモーダルな情報を統合し、複雑な身体を統御し、環境に適応できる人間の知能、および発達的なロボットの構成をその延長線上で捉えようとすると、その認知アーキテクチャとしての構造を検討する必要が現れる。WB-PGMは、人間の全能の構造に学ぶとともに、予測学習を基礎に据えた確率的生成モデルにより認知アーキテクチャを構築しようというアプローチである。本発表ではその基本的な考え方と展望に関しての報告する。
著者
鈴木 雅大 金子 貴輝 谷口 尚平 松嶋 達也 松尾 豊
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回 (2019) (ISSN:27587347)
巻号頁・発行日
pp.1L2J1105, 2019 (Released:2019-06-01)

近年,深層生成モデルの研究は急速に進んでおり,それらを簡潔かつ汎用性高く実装できるフレームワークが求められる.本研究では,最新の複雑な深層生成モデルの特徴として,確率分布によるネットワークの隠蔽,および複数の誤差関数から目的関数が構成されているという2点に着目し,それらを達成する新たな深層生成モデルライブラリ,Pixyzを提案する.本論文では,提案ライブラリが簡単な深層生成モデルの実験において,既存の確率モデリング言語であるPyroよりも高速で動作することを示し,さらに既存の確率モデリングライブラリでは実装できない複雑な深層生成モデルについて,容易かつ簡潔に実装できることを示す.
著者
湯川 直旺 鈴木 雅大 松尾 豊
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第36回 (2022)
巻号頁・発行日
pp.2G5OS18a02, 2022 (Released:2022-07-11)

脳活動データからのinner speechのデコードは, 障害を抱えた患者の意思疎通の円滑化や, メタ認知理解などに繋がると考えられる. 先行研究では, 深層学習モデルEEGNet を用いて実験が行われたが, 4 クラス分類のタスクで30% ほどの正答率であった. ここで, 転移学習を用いた特徴量抽出の精緻化が有効であると考えられる. しかしinner speech に転移学習が用いられた研究は未だなく, EEGデータ一般でも, 異なるタスクのデータや, EEG以外のデータの転移学習における有効性については, 十分に検証がなされていない. 本研究では, inner speech データセットに, ドメインやデータ量の異なるデータセットを用いた転移学習を行い, 特徴量抽出の改善を検証した. 結果, 異なる被験者のデータを用いた転移学習による精度の向上が確認できたが, 異なるタスクのEEGデータを用いた場合は精度は改善しなかった. 一方で画像データセットは, 凍結する層を工夫することで, EEGデータとは性質が異なるにも関わらず, 精度の向上が確認された.
著者
鈴木 雅大 松尾 豊
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

近年のマルチモーダル学習は,深層ニューラルネットワークが用いられることが多い.通常,ネットワークの訓練のために大量のラベルありデータ集合が必要だが,ラベル情報の付与には人的コストがかかってしまう.したがって,マルチモーダルデータにおける半教師あり学習が重要となる.これらの手法の中でも,近年深層生成モデルを用いたマルチモーダル半教師あり学習が提案されている.本研究では,まずこれらの手法を比較し,特に決定論的な対応関係がない異なるモダリティを入力とした場合,共有表現に対応する潜在変数を持つSS-HMVAEが高い性能となることを確認する.次に単一モダリティからラベルを予測するために,SS-HMVAEを拡張したモデルであるSS-HMVAE-klを提案する.この手法によって,従来のモデルと比較して,単一モダリティを入力とした場合の性能が大幅に向上することを確認した.
著者
鈴木 雅大 佐藤 晴彦 小山 聡 栗原 正仁 松尾 豊
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.57, no.5, pp.1499-1513, 2016-05-15

ゼロショット学習は,1度も学習したことのないカテゴリの画像を,補助情報を頼りに分類する手法である.ゼロショット学習を実現する様々な手法の中でも,補助情報に属性を用いた属性ベースゼロショット学習が最もよく知られている.しかし既存研究では,各属性の画像特徴量への現れやすさを考慮していなかった.本稿ではこのような度合いを属性ごとの観測確率と呼び,観測確率を含めた新たなモデルを提案した.そして提案したモデルの妥当性の検証および既存研究との比較実験によって,提案手法が既存手法と比較して有効性の高いモデルであることを示す.
著者
数原 良彦 鈴木 雅大 戸田 浩之 鷲崎 誠司
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.28, 2014

ユーザの移動履歴を用いて移動手段を判定するタスクでは,区間に対して付与された移動手段の正解ラベルと教師あり学習を用いて移動手段を判定する分類器を生成する従来手法があった.しかし,正解ラベル作成はコストが高く,現実的には大量の正解ラベルの利用は困難である.本研究では,少量の正解ラベルと正解ラベルが付与されていない移動履歴データを用いて半教師あり学習の枠組みで分類器を学習する手法を提案する.