著者
米山 暁夫 柳原 広昌 笹野 義二 中島 康之
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告オーディオビジュアル複合情報処理(AVM) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.74, pp.9-14, 2002-07-26
被引用文献数
1

本稿ではシーンの変化とシーンの特徴に適応したMPEG-4ビデオ符号化アルゴリズムを検討したので報告する。本提案では入力画像数枚をプリロードし、そのプリロードした画像のマクロブロック(MB)毎の画面内アクティビティおよびこのアクティビティを利用した動き特徴の解析により最適なI P B-VOPの配置を決定することを目的としている。通常はこれらの情報の取得には演算量の増大が避けられないが、本方式では一般的なエンコーダで利用される情報を活用するため、演算量の増大を抑えた符号化が可能となる。In this paper, we propose an encoding algorithm for MPEG-4 video encoding. In our proposal, predetermined number of input pictures are preloaded. Then picture characteristics are analized and appropriate VOP types (I, P, B) are determined before encoding. Since the processing speed of the proposed algorithm is almost equal to that of the conventional MPEG-4 encoder without adaptive VOP types control, fast encoding can be realized with better picture quality than that of without the control of VOP types.
著者
中島 康之 陸 洋 菅野 勝 柳原 広昌 米山 暁夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.5, pp.1361-1371, 2000-05-20
被引用文献数
23

キーワードスポッティングやコンテンツベースのオーディオビジュアル検索システムにおいては動画像のショット切換り点の検出やオーディオ情報の自動分類が非常に重要な課題になる.本論文では, MPEG符号化データからオーディオ情報をサブバンド上で高速に分類する手法を提案する.まず無音区間をサブバンドエネルギーの分散を用いて検出し, 次に有音区間に対してサブバンドデータの時間的エネルギーの疎密度, 平均サブバンド数とサブバンド重心を用いて音楽, 音声, 歓声雑音の3種類のクラスに分類した.識別法としてはクラス数や識別条件が増加するに従い複雑になるしきい値法に代わってBayes決定における正規分布に対する最適識別関数を用いた.分類実験では, MPEGオーディオデータを1秒単位に分類し, 90%以上の精度で無音や音声区間を検出することができ, 検出処理はMPEGオーディオ復号処理時間の1/6以下で検出が可能になった.
著者
滝嶋 康弘 米山 暁夫 宮地 悟史 柳原 広昌 中島 康之 和田 正裕
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. CS, 通信方式 (ISSN:09135685)
巻号頁・発行日
vol.101, no.494, pp.37-42, 2001-12-06

携帯電話に対するビデオ配信用コンテンツ制作システムの設計法を提案する。モバイルマルチメディアが注目される中、そのコンテンツ制作は従来のインターネット配信向け制作環境などとは異なる要求条件を有する。受信端末環境、伝送ネットワーク環境、製作環境における低レート伝送、素材時間短縮、補助情報・テロップ挿入、一素材多利用等の条件を考慮し、低レートAV符号化、高機能AV編集、軽量テロップフォーマット、高速フォーマット変換等の特徴を持つ制作システムを提案する。本設計に基づくソフトウエアシステムの開発に関しても報告する。
著者
滝嶋 康弘 米山 暁夫 宮地 悟史 柳原 広昌 中島 康之 和田 正裕
出版者
一般社団法人映像情報メディア学会
雑誌
映像情報メディア学会技術報告 (ISSN:13426893)
巻号頁・発行日
vol.25, no.83, pp.37-42, 2001-12-13

携帯電話に対するビデオ配信用コンテンツ制作システムの設計法を提案する。モバイルマルチメディアが注目される中、そのコンテンツ制作は従来のインターネット配信向け制作環境などとは異なる要求条件を有する。受信端末環境、伝送ネットワーク環境、制作環境における低レート伝送、素材時間短縮、補助情報・テロップ挿入、一素材多利用等の条件を考慮し、低レートAV符号化、高機能AV編集、軽量テロップフォーマット、高速フォーマット変換等の特徴を持つ制作システムを提案する。本設計に基づくソフトウエアシステムの開発に関しても報告する。
著者
滝嶋 康弘 米山 暁夫 宮地 悟史 柳原 広昌 中島 康之 和田 正裕
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. AVM,[オーディオビジュアル複合情報処理] (ISSN:09196072)
巻号頁・発行日
vol.35, pp.37-42, 2001-12-13

携帯電話に対するビデオ配信用コンテンツ制作システムの設計法を提案する。モバイルマルチメディアが注目される中、そのコンテンツ制作は従来のインターネット配信向け制作環境などとは異なる要求条件を有する。受信端末環境、伝送ネットワーク環境、制作環境における低レート伝送、素材時間短縮、補助情報・テロップ挿入、一素材多利用等の条件を考慮し、低レートAV符号化、高機能AV編集、軽量テロップフォーマット、高速フォーマット変換等の特徴を持つ制作システムを提案する。本設計に基づくソフトウエアシステムの開発に関しても報告する。
著者
滝嶋 康弘 米山 暁夫 宮地 悟史 柳原 広昌 中島 康之 和田 正裕
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. IE, 画像工学 (ISSN:09135685)
巻号頁・発行日
vol.101, no.496, pp.37-42, 2001-12-06
被引用文献数
1

携帯電話に対するビデオ配信用コンテンツ制作システムの設計法を提案する.モバイルマルチメディアが注目される中, そのコンテンツ制作は従来のインターネット配信向け制作環境などとは異なる要求条件を有する。受信端末環境、伝送ネットワーク環境、制作環境における低レート伝送、素材時間短縮、補助情報・テロップ挿入、一素材多利用等の条件を考慮し、低レートAV符号化、高機能AV編集、軽量テロップフォーマット、高速フォーマット変換等の特徴を持つ制作システムを提案する。本設計に基づくソフトウエアシステムの開発に関しても報告する。
著者
清水 智行 米山 暁夫 柳原 広昌 中島 康之
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告オーディオビジュアル複合情報処理(AVM) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.99, pp.23-28, 2003-10-03
被引用文献数
4

H.264はMPEG-4やH.263などの従来の動画像圧縮符号化方式に比べて最大で2倍の符号化効率を目標とした符号化方式である。しかし、従来方式に比べて符号化処理の複雑さが非常に大きいため、実用化のためには符号化処理を効率よく行なうための手法が必要である。本稿では、H.264の複数ブロックサイズによる動き補償予測処理において、ブロックサイズの選択および動きベクトル探索処理を高速に行なうための手法について検討する。具体的には、最初に小さなブロックサイズでの動き探索を行ない、隣接ブロックの動きベクトルの類似性から、より大きなブロックサイズを適応的に選択し、かつ探索範囲を絞り込むことによって、H.264参照モデルJMと比較して0.1-0.4dBのPSNR低下で予測誤差計算回数を6-7%に削減することができた。H.264 is a new video coding standard, which has coding efficiency about twice as much as existing standards such as MPEG-4, H.263, etc. Because it has larger computation complexity than existing standards, faster coding algorithms are desired for practical use. We propose a fast algorithm for multiple block size motion estimation. In this algorithm, motion vectors in smaller-sized block are searched at first, and a more suitable block size is chosen and search range is limited according to similarity of the motion vectors. As a result, search steps are reduced to about 6-7% of the H.264 Reference Model (JM), while loss of PSNR is at most 0.1-0.4 dB.