- 著者
-
岡谷 貴之
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会研究報告. SLP, 音声言語情報処理
- 巻号頁・発行日
- vol.2015, no.11, 2015-05-18
一枚の画像からそこに写る物体の名前を答える物体カテゴリ認識は,コンピュータビジョンの長年の課題であったが,ディープラーニングの登場,正確には畳込みニューラルネットの 「再発見」 により大きく進展し,人の視覚と比肩するほどまでになった.一方,その他の多くの画像認識のタスク,例えば特定の物体を画像中で位置決めする 「物体検出」 や,人のポーズ認識,さらには動画像を使った人の行動認識に対しては,物体カテゴリ認識ほどはディープラーニングは成功していない.従来法を超えるという意味では一定の有効性が確認されているものの,これらのタスクでの性能は,人の視覚まではまだ相当の隔たりがある.また,物体カテゴリ認識あるいはその類似タスクに極めて高い精度を発揮する畳込みニューラルネットだが,なぜそんなに高い性能が出るのかの理解が追い付いていない.本講演では,この辺りの現状についてまとめ,今後を占うことを試みたい.