著者
天野 美紀 上原 邦昭 熊野 雅仁 有木 康雄 下條 真司 春藤 憲司 塚田 清志
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.44, no.3, pp.915-924, 2003-03-15
被引用文献数
11

映像の編集とは,素材映像の中から編集に用いることができるショットを選択し,それらを接続する作業である.これらのショットの接続の仕方は無限に存在する.しかし,作者側の意図することを視聴者に正確に伝えることを目的として編集した場合,ある普遍的な規則が存在する.これを「映像文法」と呼ぶ.本稿では,編集作業を支援することを目的として,映像文法に基づいた自動編集システムを提案する.本システムでは,まず,素材映像からショットの切り出しと,切り出した個々のショットに対して属性値の付与が行われる.次に,映像文法をルール化したプロダクションシステムを用い,推論を重ねることによって,属性値を付与された素材映像集の中から適切なショットを選択し編集を行うようになっている.The video editing is a work to produce the final video with certain duration by finding and selecting appropriate shots from material videos and connecting them.In other to produce the excellent video,this process is generally conducted according to the set of special rules called ``video grammar''.In order to make video grammar applicable,the metadata such as shot size or camera work included in shots have to be extracted and indexed.The purpose of this study is to develop an intelligent support system for video editing system where these metadata are extracted automatically and then the video grammars are applied to them.
著者
熊野 雅仁 有木 康雄 春藤 憲司 塚田 清志
出版者
一般社団法人映像情報メディア学会
雑誌
映像情報メディア学会誌 : 映像情報メディア (ISSN:13426907)
巻号頁・発行日
vol.57, no.7, pp.829-839, 2003-07-01
参考文献数
17
被引用文献数
10 3

Video editing is used to produce a final version with a specific duration by finding and selecting appropriate shots from the raw video material and connecting them. Video editing process is generally conducted according to the special rules called "video grammar" in order to produce excellent and intelligible videos for broadcasting. However, this editing consumes a lot of human editor's working time. To solve this problem, an efficient and new video editing technique or system is required. The goal of this study is to develop an intelligent support system for video editing based on video grammar. This paper proposes a method of using camerawork density, camerawork instability, and cut point parameters to automatically segment the raw video materials into useful sections and useless sections. The method is based on video grammar as a part of the video editing support system.
著者
重森 猛 金子 剛志 緒方 淳 藤本 雅清 有木 康雄 塚田 清志 濱口 伸 清瀬 基
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.102, no.618, pp.33-40, 2003-01-23
参考文献数
14
被引用文献数
6

本研究では、野球のラジオ実況中継音声に対して大語彙連続音声認識を行い、キーワードを抽出してハイライトシーンを検出することを目的としている。音声認織部をより頑健にするために、音響モデルでは、MLLR+MAP適応による教師あり、教師なし適応を行っている。この音響モデルの2段階適応を用いることにより、アナウンサーの話者性に適応することができ、ベースラインに比べ単語正解精度で約28%の改善が得られた。言語モデルでは、言語モデルの融合、選手名のクラス化、発音辞書の修正を行い、ベースラインに比べ単語正解精度で約13%の改善が得られた。それぞれの適応を統合することにより、単語正解精度で約38%の改善が得られた。