著者
富永 英義 MUSMANN H. JUDICE C. KUNT M. CHIARIGLIONE エル 小舘 亮之 児玉 明 安田 浩 小松 尚久 相沢 清晴 田崎 三郎 酒井 善則 安田 靖彦 JOZAWA Hirohisa YABUSAKI Masami MIKI Toshio SAKURAI Yasuhisa FUKUDA Toshio ALGAZI V. SHAFER R. KOMIYA Kazumi ALGAZI V PROF.H. Musm SHAFER R. 羽鳥 光俊 原島 博 辻井 重男 花村 剛
出版者
早稲田大学
雑誌
国際学術研究
巻号頁・発行日
1994

前年度の活動の成果として得られた、シンタックス、ツール、アルゴリズム、プロファイルという4つの異なる要素から構成するフレームワークを基本構造とし、今年度は,主に,具体的要素技術の比較および評価,確認実験モデルの作成,動画像ドキュメントアーキテクチャの概念に基づく符号化方式の具体化作業を行なった。まず、具体的要素技術の比較評価テストについて。Functionality、テスト画像クラス、ビットレートによって評価対象を分類し、比較評価テストを行なった。ただし、テストの際、基準となる比較対象(アンカー)として、CIFフォーマットを用いたMPEG1およびCIFあるいはQCIFを用いたH.263を使用した。比較評価の結果、10kbpsを中心とした低ビットレート範囲ではビットレートが高くなるほどアンカーおよびブロックベース手法の結果が良好であること、低ビットレートにおいてはフレームレートの設定がその画質評価結果を大きく左右する要因であること、Content based functionaliesを有する方式はアルゴリズムの種類が増大し要素としての評価が難しい傾向を示すこと、が主に明らかとなった。良好な性能を示す要素技術の候補としては、long term memory, short term memoryを併用する手法、イントラフレームにウェーブレットを適用する手法、グローバル動き補償とローカルアフィン動き補償の組合わせ、ブロック分割手法、matching pursuits手法等が挙げられた。次に、確認実験モデルの作成について。長期に渡る議論の結果、確認実験モデルとしてはビテオオブジェクト平面という概念で表される複数のビテオコンテントを入力情報源として適用可能なモデルが選択された。この確認モデルは、H.263の拡張動きベクトルおよびアドバンスト予測方式を採用すること、2値形状は4分木符号化、多値形状は4分木符号化+VQを使用すること、コンテント境界はpaddingを行って符号化することを主な条件として作成されることとなった。最後に、動画像ドキュメントアーキテクチャの概念に基づく符号化方式の具体化について。メディアの統合的扱いが可能なフォーマットおよび既存データの再利用機能が将来のマルチメディア情報環境において特に重要であるという観点から、文書の編集加工処理を構造的に行なうデータアーキテクチャであるODAの概念をビデオ・ドキュメントアーキテクチャ(VDA)として動画像符号化への適用を試みた。まず、ビデオコンテントをカメラの光軸に垂直な単一の静止平面(背景のみ)と仮定しこれを入力としてカメラパラメータを分離符号化する方式を検討した。続いて、αマップと原画像情報を入力として、VDAの概念に基づいたプロセッサブル符号化方式を検討した(H.263を基本とし、任意形状に対応した直交変換、αマップ符号化、コンテント・時間単位データ多重化を主に加えた構成)。実験の結果、前者の方式は正確なカメラパラメータが計測できる場合約50[dB]の平均SNRで複号化できる能力をもち、検出するパラメータ誤差が蓄積するに従ってこの値が急激に減少する傾向を子示すことが分かった。また、攻守の方式については、カメラ操作およびビデオコンテントの移動・消去・表示優先度・追加等の編集シミュレーションを行ない、意図した動画像の編集加工機能・データ再利用機能がVDAモデルにより効果的に実現されていることを確認した。また、簡単な加工用データ操作記述言語を試作することにより、編集処理の迅速性、内容の可読性が大きく向上されることを示した。今後は、画像合成を行なう際のMapping処理の高速化、ビテオコンテントのデータのバッファリング処理、透明度を考慮したαマップ符号化、ランダムアクセス機能の実現手法・ドキュメントアーキテクチャの概念で扱えるメディア範囲の拡張などが課題として挙げられた。
著者
花村 剛 市川 正浩 伊藤 朝香 福山 江里子 太田 啓路 朴芝皓
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告オーディオビジュアル複合情報処理(AVM) (ISSN:09196072)
巻号頁・発行日
vol.2004, no.65, pp.35-40, 2004-06-18
被引用文献数
2

現在のコンテンツ制作は、大画面から携帯端末の画面にいたるまで多様な受信端末にあわせて個別に行っており、非効率的であるといえる。そこで筆者らは、高精細コンテンツを、多様な受信端末に合わせスケーラブル変換するアーキテクチャを開発した。さらに受信端末やカテゴリに適したコンテンツの変換(クロップ、縮小)方法について人間工学的検討を行ったので報告する。This research aims to establish a scalable conversion method of video contents according to the video contents or the display capacity of the receiving termihal. We examined the three crop (cut) methods when converting HD videos to QVGA and SQVGA size. The appropriate crop methods for display size were discussed from the results of the user evaluation experiments.