著者
栄藤 稔
出版者
総務省情報通信政策研究所
雑誌
情報通信政策研究 (ISSN:24336254)
巻号頁・発行日
vol.7, no.1, pp.25-51, 2023-11-20 (Released:2023-12-28)
参考文献数
51

生成AIの技術進化が2022年から急激に加速し、ユーザーを取り込んだ新たなコンテンツ経済圏が形成されようとしている。2014年に発明されたGAN(生成的敵対ネットワーク)という技術により、人が区別できないほど精巧な画像が自動生成されるようになった。さらに、2016年、データを高度に抽象化する深層学習技術、トランスフォーマーが登場した。これは「データを与えさえすれば機械が自動学習する」という教師なし学習の大きなブレークスルーとなった。そして2022年、ChatGPTに代表されるコンテンツを自動生成する技術が登場し、多様なメディアを対象として急速に進化しようとしている。深層学習の進化、音声や画像認識の実用化、そしてこれらの技術組み合わせることで、従来人間が行っていた文章の執筆、絵の描画、楽曲の制作、動画の撮影や編集といったクリエイティブな作業がAIによって置き換えられる時代が到来した。コンテンツ制作の主体がプロのクリエーターから一般の人々へと移行する可能性が出てきた。従来のクリエーター中心の視点から、ユーザー中心の視点へのコンテンツ経済圏のシフトが予見される。AIが作成したコンテンツをAIGC(AI Generated Content)と呼ぶ。それがどのような経済圏を作るかを議論したい。脚本の生成や俳優の演技のデジタル複製・変更が簡単に行えるようになり、これが脚本家や俳優の役割や権利への影響をもたらすことが予想される。このような変化は、クリエーターとして知られる脚本家、アニメーター、俳優などの様々な分野の専門家たちの生態系に大きな変動を引き起こす可能性がある。日本には、ポケモンに代表されるキャラクターコンテンツを中心とした世界的に成功を収めているメディアフランチャイズ事業や、ユーザー主導でのコンテンツの流通を特徴とするコミュニケーションマーケットなどの独自の文化が存在する。その代表例として初音ミクを取り上げる。デジタル技術の進化、ユーザーの積極的な参加、ファンの熱狂、そして柔軟な著作権管理を組み合わせたビジネスモデルが、日本において生成AIを効果的にビジネスに取り入れるための良い土壌を形成している。今後、ソーシャルメディアと生成AIの組み合わせによって、ユーザー生成コンテンツ(UGC)がAIGCと一体化し、世界的に広がっていくことが期待される。一方で、生成AIの技術の利用には、著作権法の問題や倫理的な課題など、様々な問題が伴う。特に、人間の感性や独自性を持つコンテンツの生成に関しては、AIとのバランスをどのように取るかが重要となる。生成AI技術と人間のクリエーターが対立するのではなく、互いに共存し、新しい形のコンテンツを共に生み出すことが、今後のコンテンツ産業の発展の鍵となる。
著者
馬場口 登 栄藤 稔 佐藤 真一 安達 淳 阿久津 明人 有木 康雄 越後 富夫 柴田 正啓 全 柄東 中村 裕一 美濃 導彦 松山 隆司
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.102, no.155, pp.69-74, 2002-06-20
被引用文献数
35

電子情報通信学会パターン認識・メディア理解研究会の下で検討,作成した映像処理評価用映像データベース(VDB:Video Data Base)について述べる.このデータベースは編集効果(シーン切替),カメラワーク,テロップの出現,音声品質という点においてテレビ放送に匹敵する品質の素材映像をもち,ニュース,ドラマ,ドキュメンタリー,情報番組(料理,観光)などのジャンルの映像からなる.また,ショット境界やシナリオ情報をMPEG7形式のメタデータとして付与している.各種の映像処理アルゴリズムを比較評価するためのベンチマークデータとして利用されることが期待される.
著者
山添隆文 栄藤稔 吉村健 辻野孝輔
雑誌
画像の認識・理解シンポジウム(MIRU2011)論文集
巻号頁・発行日
vol.2011, pp.409-415, 2011-07-20

本稿では,重みつき有限状態トランスデューサ(WFST)を用い,ノイズ領域が文字列として誤検出されることが課題となる情景画像からの日本語語彙検出手法を提案する.提案手法では,情景画像から網羅的な文字候補を抽出し,それらすべての組み合わせを表現したWFST と,大規模な語彙データセットから辞書を構成するWFSTとを合成することより,最終的な語彙検出結果を得る.これにより,辞書に含まれない文字候補の組み合わせとなるノイズ領域を除去することが可能となる.また,情景画像からの文字候補の抽出において,画像における位置情報を保持したままWFST を生成するため,同一の画像領域から最適な語彙を検出することができる.日本語を含む情景画像のデータセットにより検証を行い,ノイズ領域を除去しつつ日本語の語彙を検出できることを確認した.
著者
関口 俊一 栄藤 稔 江村 恒一 藤川 渡 益満 健 越後 富夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.101, no.302, pp.51-58, 2001-09-06
被引用文献数
1

XML-Schemaに基づくマルチメディア構造表現として2001年10月に標準化が予定されているMPEG-7の運用ポイントをダイジェスト視聴の視点で紹介する.ここでは, 膨大なMPEG-7の記述セットの中から, セグメント構造記述, 属性キーワード記述を選択した.実際の応用として, 映像の自動シーンカットを行い, それに属性キーワードを付随させるオーサリングシステムと, その結果得られるMPEG-7データとユーザ嗜好とのマッチングを端末側で行うことにより要約視聴を可能とするパケットストリーミングシステムを構築した.これにより, 長時間の映像コンテンツをユーザの視聴環境や嗜好に合わせてモバイル網で要約配信することが可能となる.
著者
栄藤 稔
出版者
日本医用画像工学会
雑誌
Medical Imaging Technology (ISSN:0288450X)
巻号頁・発行日
vol.12, no.1, pp.9, 1994 (Released:2016-03-23)
被引用文献数
4
著者
横矢 直和 山澤 一誠 岩佐 英彦 竹村 治雄 荒木 昭一 栄藤 稔 栄籐 稔
出版者
奈良先端科学技術大学院大学
雑誌
基盤研究(B)
巻号頁・発行日
1997

1.全方位ステレオ画像センサの設計・試作まず最初に、2つの異る回転2葉双曲面を接合した複合双曲面ミラーとビデオカメラからなる全方位ステレオ画像センサStereo HyperOmni Visionの設計・試作を行なった。本センサは、現状のビデオカメラを用いる限り、画像の解像度に問題があり、実用化には超高解像度ビデオカメラの出現が待たれる。次に、この解像度の問題を解決するために、ピラミッド型六角錐ミラーと6台のカメラにより側方360度を撮像し、同じ構造を上下対称に配置することによってステレオ撮像を可能にする全方位ステレオ画像センサPYMSを開発した。2.全方位画像からのパノラマ画像及び任意視線画像の実時間生成試作したセンサは単一視点制約を満たすため、任意形状の投影面への1点中心投影像を計算によって求めることができる。本課題では、この画像変換の実時間処理を実現するために、離散的な点での座標変換とハードウェアによる画像変形を組み合わせた手法を開発した。また、画像提示デバイスとして頭部搭載型画像表示装置(HMD)と全周型景観提示システムを用いたテレプレゼンスシステムのプロトタイプを開発し、提案手法の有効性を実証した。3.時系列全方位画像及びパノラマ画像の高能率符号化時系列全方位画像及びパノラマ画像の特性を活かしたビデオストリームからの動き推定法と高能率圧縮符号化方式を開発するとともに、多地点全方位画像から任意視点画像を生成する手法を開発した。4.全方位ステレオ画像からの3次元情報の抽出本研究で設計・試作した全方位ステレオ画像センサは縦方向の視差を有するため、人間への画像提示の観点からは、横視差をもつステレオ画像への変換が必要である。このため、相関法によるステレオマッチングによりシーンの奥行き情報を抽出する全方位ステレオ視のアルゴリズムを開発した。
著者
畑 幸一 栄藤 稔
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.84, no.1, pp.56-63, 2001-01-01
被引用文献数
1

2枚の画像の画像相関を基準とするエピポーラ幾何パラメータ推定方法を提案する.本手法の特徴は, 画像間の特徴点対応を用いた従来のエピポーラ幾何パラメータ推定法と異なり, 画像内のブロックマッチングの結果を2次関数によって近似したパラメトリックブロック相関関数を用いることである.本手法では, まず, 2枚の画像でブロックマッチングを行い, パラメトリックブロック相関関数を得る.次に, 得られたパラメトリックブロック相関関数をエピポーラ幾何パラメータによりロバスト推定を用いて最小化し, エピポーラ幾何パラメータを推定する.本論文では, 線形解法に基づいてエピポーラ幾何パラメータを推定する手法を述べ, それを初期値として非線形解法に基づいてエピポーラ幾何パラメータを推定する手法を述べる.最後に, 実画像を用いた実験によって, 画像相関が高いエピポーラ幾何パラメータが推定できることを示す.それにより, 本手法は, 画像符号化の符号化効率向上や画像合成の画質向上に有効であることを確認した.
著者
山口 孝雄 栄藤 稔
出版者
一般社団法人映像情報メディア学会
雑誌
映像情報メディア学会誌 : 映像情報メディア (ISSN:13426907)
巻号頁・発行日
vol.52, no.7, pp.1055-1061, 1998-07-20

We propose a synchronized audio and visual (AV) decoding scheme that is tolerant of variation in the processing environment, assuming that the future AV terminal will be implemented by software. The processing environment means the set of conditions, such as workload and equipment, that defines AV processing ability. Due to its software implementation, the AV terminal might encounter fatal degradation in decoding quality when the processing environment deteriorates. To prevent this, our scheme introduces a prioritized frame packet structure (access unit) to the AV bitstream, in which the access units are selectively discarded by comparing their processing priorities with the discarding threshold. The processing priority for each access unit is determined by the relative importance of each AV stream and the relative importance of each frame within the stream. The discarding threshold is adjusted according to a decoding time stamp attached to the access unit. The proposed scheme allows us to provide the workload adjusting mechanism independently of underlying terminal implementation ; the decoding quality is gracefully degraded in the case of high workload. Experimental results show the effectiveness of our scheme against variations in the processing environment.