著者
湯志遠 柳井 啓司
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.42, pp.209-216, 2007-05-15

TRECVID とは、共通テストコレクションを用いたビデオ検索技術に関する研究開発促進のための国際ワークショップである。本研究では、TRECVID の中の4つのタスクのうちの1つである、提供されたニュース映像から切り出されたフレーム画像の中から特定の事象と一致する画像を抽出する high-level feature extraction task (高次特徴抽出タスク)について扱う。本研究では、このタスクに対して、bag-of-keypoints モデルによる画像認識を適用し、結果の評価を行う。認識する事象は TRECVID2006 の評価対象になっている Sports、Weather、Office など20種類とした。分類手法としては、最近傍法と SVM を用い、両者の結果を比較した。TRECVID is an international workshop for research and development promotion about video search technology. TRECVID provides common test data and four kinds of tasks, and participants compete on their results regarding the given tasks. In this research, we tackle the high-level feature extraction task which is one of four tasks in TRECVID. In the high-level feature extraction, we extract frame images in which a specific kind of features appears from the provided news video. For this task, we applied the bag-of-keypoints model which is a state-of-the-art method on generic object recognition, and used nearest neighbor classifier and SVM as classifiers. The features we made experiments on are 20 kinds of features including Sports, Weather, Office, Mountain, Animal and Car.