著者
勝手美紗 内海ゆづ子 黄瀬浩一
雑誌
研究報告コンピュータビジョンとイメージメディア(CVIM)
巻号頁・発行日
vol.2012, no.5, pp.1-7, 2012-11-26

本稿では,インターネット上の大規模な動画像を自動で分類することを目的とし,動画像中のイベントを検出する.インターネットで配信されているホームビデオなどの動画の多くは視点が固定されずに撮影されているため,動画像から人物や物体の動きの情報を取得することは困難であり,行動認識などの技術を用いてイベントを検出することは困難となる.また,イベントは行われる環境や環境を構成する物体に大きく依存する.そこで,動画像中の背景や動画像中に登場する物体に着目し,イベントの検出を行う.背景からは, Opponent SIFT 特徴量を Bag-of-Feature で表現したものを特徴量として抽出する.物体特徴量には,動画像から物体検出器により検出した物体の頻度と識別器の信頼度の値を用いる.それぞれ特徴量を用いて最近傍探索を行い,結果を統合することでイベントの認識を行った.評価は TRECVID2012 Multimedia Event Detection タスクのデータセットを用いて行った.その結果,特定の環境でのみ行われるイベントと動画中の物体を高い精度で検出できたイベントを検出できた.