著者
伊藤一成 酒井 康旭 斉藤 博昭
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告データベースシステム(DBS) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.3, pp.41-48, 2004-01-15
被引用文献数
2

本稿は自然言語処理を核とした新たな動画要約手法を提案する。動画内容はすべてメタデータを用いて表現できると仮定すると、音声と映像を分離して要約することが可能となる。すなわち、ユーザが指定する任意の要約率で音声テキストを要約した後に、対応する映像の重要区間を決定する。要約結果の提示の際には映像の重要区間を再生するのと同時に、日本語スピーチエンジンを利用して要約テキストを音声に変換することで、音声と映像の一貫性を考慮した要約生成が実現できる。ニュース報道番組の動画要約システムを試作し、提案手法の有効性を確認した。This paper proposes a novel movie summarization method based on meta data analysis and text processing. Since all the contents of a movie can be described in a meta data format, it becomes possible to summarize the movie in two layers: sound and video. Namely, the speech contents are firstly abridged at an arbitrary condense rate using natural language techniques. Then important video sections are determined corresponding to the selected speech parts. When the summarized result is presented, the video sections are reproduced along with the synthesized speech of the abridged text. This summarization method assures the consistency of sound and video. We have implemented a news summarization system and confirmed the effectiveness of our approach.