- 著者
-
柳井 啓司
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会論文誌コンピュータビジョンとイメージメディア(CVIM) (ISSN:18827810)
- 巻号頁・発行日
- vol.48, no.16, pp.1-24, 2007-11-15
- 被引用文献数
-
68
「一般物体認識」とは,制約のない実世界シーンの画像に対して計算機がその中に含まれる物体を一般的な名称で認識することで,コンピュータビジョンの究極の研究課題の1つである.人間は数万種類の対象を認識可能であるといわれるが,計算機にとっては,同一クラスに属する対象のアピアランスが大きく変化するために以前はわずか1種類の対象を認識することすら困難であった.ここ数年,新しいモデル表現の提案,機械学習法の進歩,計算機の高速化などにより,急速に研究が進展しており,現在は101種類の対象に対して6割程度の精度で認識が可能となってきている.本論文では,一般物体認識研究のサーベイを手法に加えて,データセット,評価ベンチマークについて行い,さらにその今後について展望する."Generic object recognition" aims at enabling a computer to recognize objects in images with their category names, which is one of the ultimate goals of computer vision research. The categories which are treated with in generic object recognition have broad variability regarding their appearance, which makes the problem very tough. Although human can recognizeten thousands of kinds of objects, it is extremely difficult for a computer to recognize even one kind of objects. For these several years, due to proposal of novel representation of visual models, progress of machine learning methods, and speeding-up of computers, research on generic object recognition has progressed greatly. According to the best result, the 66.23% precision for 101-class generic image recognition has been obtained so far. In this paper, we survey the current state of generic object recognition research in terms of datasets and evaluation benchmarks as well as methods, and discuss its future directions.