著者
岡谷貴之 齋藤真樹
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2013-CVIM-185, no.18, pp.1-17, 2013-01-16

ディープラーニングは,多層のニューラルネットワーク(以下NN)を用いる機械学習の方法論である.最近,これに基づく方法群が,画像認識のベンチマークテストで従来の記録を次々に塗り替えた他,音声認識やその他の学習・認識の問題に応用されて同様に高い性能を示すに至り,幅広い関心を集めつつある.本稿では,このディープラーニングについて,画像認識への応用を念頭に,現時点で知られている様々な方法をなるべく網羅的に説明する.具体的には,NNの基本構成から,Convolutional NN,プーリング,局所コントラスト正規化,教師なし学習であるプレトレーニング,オートエンコーダ,スパースな特徴表現を可能にする複数の方法,Restricted Boltzmann MachineやDeep Belief Networkなどの生成モデルに基づくディープラーニングの各手法を,それぞれ説明する.またディープラーニングのためのソフトウェアライブラリにも触れる.