- 著者
-
金子 卓弘
平松 薫
柏野 邦夫
- 雑誌
- 研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:21888701)
- 巻号頁・発行日
- vol.2017-CVIM-208, no.36, pp.1-8, 2017-09-08
本稿では生成的属性制御と呼ぶ新しい問題に取り組む.生成的属性制御では,画像の生成または編集を,属性内多様性 (例えば,笑顔属性であれば微笑み,大笑い,にやり笑いなどの様々な笑い方) を直感的に制御しながら行えるようにすることを目指す.これを実現するためには,画像の表現空間があった時に,(1) 個人性と属性が分離され,さらに,属性に対して (2) 高い表現力と (3) 高い操作性が得られていることが必要になる.これらを満たすために,本稿では Conditional Filtered Generative Adversarial Networks (CFGAN) と呼ぶ Conditional GAN (CGAN) の新しい拡張モデルを提案する.CGAN は GAN を条件付き設定に拡張したもので,属性の観測変数を生成器と識別器の入力に組み込むことで,表現空間内で個人性と属性を分離することを可能にしている.一方で,表現力と操作性は観測変数に強く制約されており,例えば,観測変数が属性の有無を表すバイナリであればオン ・ オフの制御しかできなかった.これに対して,CFGAN では新たにフィルタリング構造と多次元の隠れ変数を導入し,属性の観測変数の値に応じて隠れ変数のフィルタリングを行う.これにより属性は多次元的に表現されるため表現力を高めることが可能であり,さらに,フィルタリング構造と隠れ変数の分布形状を工夫することで様々な制御を実現することが可能である.実験では,CFGAN を MNIST,CUB,CelebA データセットに適用し,様々なデータに対して属性内多様性を制御しながら画像を生成または編集できることを示す.さらに,本手法を属性転写と属性に基づく画像検索の二つのタスクに適用し,本手法が属性の表現学習にも有用であることを示す.