著者
古山 浩志 八塩 仁 江村 恒一 井上 郁夫 遠藤 充 星見 昌克
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎 (ISSN:09135685)
巻号頁・発行日
vol.99, no.183, pp.67-72, 1999-07-15

蓄積された大量の映像データから所望の映像を高速に検索するための方式として、予め音声チャンネルから音声認識によりメタデータを自動生成しておき、このメタデータに対して入力したキーワードの検索、特定シーン映像を頭だし再生する映像検索システムを試作した。メタデータ生成部では、入力音声からCV/VCラティスの時系列データを生成し、メタデータとしてMPEG2-TSストリーム中にPESパケットとしてVideoとAudioのPESパケットとともに多重化する。メタデータ検索部では、DPマッチングを用いてCV/VCラティスを時系列データとし、入力キーワードとの照合処理を行うことにより検索を行う。ニュース番組を想定した文を対象として検索実験を行った結果、約80%の検出率を得た。