著者
藤本 雅清 鷹尾 誠一 有木 康雄 松本 宏
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.68, pp.49-54, 2001-07-13
参考文献数
16

本研究では,社内で製作された商品の紹介映像を個々の商品区間へ分割(トピックセグメンテーション)し,商品名をインデックスとして付与するシステムの検討を行った.本研究におけるシステムでは,商品紹介映像の音声から音楽などの雑音を除去した後にキーワードスポッティングを行い,抽出された商品名を用いてトピックセグメンテーションを行っている.また,キーワードスポッティングにより商品名を抽出するためには,商品名辞書が必要となるが,本研究では,商品名辞書が事前に存在していない場合に,映像中のテロップ文字を利用して,オンラインで自動生成する手法についても検討を行った.実験の結果,商品名辞書が事前に存在している場合で約82%,商品名辞書を自動生成した場合で約60%の精度で区間分割を行うことができた.In this paper, we propose a method to segment goods catalog video into individual sections and index them. Our proposing method uses the keyword spotting which extract the keywords from noise reduced speech signal within the goods catalog video. In order to extract the keywords by using keyword spotting, the goods name dictionary is required. In this paper, we study a method to generate the goods name dictionary automatically, by using the video captions within the goods catalog video. As the experimental result, the proposed method could segment the individual goods sections with approximately 82% accuracy when the goods name dictionary is available, and with approximately 60% accuracy when goods name dictionary is generated automatically.