著者
藤堂 健世 安田 翔也 山村 雅幸
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第34回全国大会(2020)
巻号頁・発行日
pp.3Rin469, 2020 (Released:2020-06-19)

機械学習における敵対的攻撃が注目を集めている。ブラックボックスなニューラルネットに対する普遍的かつ標的型の敵対的攻撃は困難と言われており、これを利用したニューラルネットの構造解析の知見は未だ十分とは言えない。本稿では,ブラックボックス・普遍的・標的型攻撃のための画像ノイズを遺伝的アルゴリズムによって作成し、これを適用した他クラスサンプルの圧縮空間上での遷移挙動から,ニューラルネットワークの特徴量構造の特性を調査した.その結果、あるクラスに対する標的型ノイズが、他クラスのサンプルに特徴的な遷移を誘導する「巻き込み」現象が観察された。巻き込みの発生度合いはクラスごとに異なったため、クラスごとに敵対的攻撃に対する耐性が異なることが示唆された。これらはクラスの距離に対応する何らかの指標と解釈することができ,ひいては特徴量空間の解析の糸口になると考えられる.