著者
佐藤 季久恵 坂井 栞 高屋 英知 山内 和樹 大矢 隼士 栗原 聡
出版者
人工知能学会
雑誌
2018年度人工知能学会全国大会(第32回)
巻号頁・発行日
2018-04-12

私たちは日常生活をおくる上で「空気を読むこと」について意識しないことはない.「空気」というものには実態がないが,日本人は度々物事の決定を「空気」に委ねることがある.よって場の「空気」である場の雰囲気をデザインするということが非常に重要になってくる.我々は中でもBGMに着目した.BGMには人をリラックスさせる感情誘導効果や店の雰囲気を明るくするようなイメージ誘導効果などがあり,大きな労力を必要とすることなく空間の雰囲気を変えることが可能である.本研究では,店舗の雰囲気を反映したBGMを推薦するシステムの構築を行う.撮影された店舗内動画に異なる環境音を組み合わせ,仮想店舗動画を作成する.その動画に対しラベル付けしたものを正解データとして学習を行う.楽曲に対しても同様のラベル項目を使用し,学習を行う.店舗内動画との類似度が高いものを推薦し,店舗の動画に対して適切であるかの評価実験を行った.
著者
平井 辰典 大矢隼士 森島 繁生
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.54, no.4, pp.1254-1262, 2013-04-15

本論文では,任意の入力楽曲を基に,既存の音楽動画コンテンツを再利用し,音楽と映像が同期した音楽動画を自動生成するシステムを提案する.本研究では,まずシステムの土台となる音楽と映像の同期手法を主観評価実験により検討した.その結果に基づき,音のエネルギーを表すRMSの変化に,映像のアクセント(明滅や動きなど)を対応させるような音楽動画自動生成システムを実装した.音楽動画の自動生成の手順は以下のとおりである.まずデータベースの構築として既存の音楽動画の各フレームにおける明滅,動きに関する映像特徴量の計算を行う.そして,動画生成として,入力楽曲のRMSを抽出し,その推移に最も近い推移を示す映像特徴量を持つ音楽動画の素片をデータベースから探索し,それらの映像を切り貼りすることで,音楽に最も同期した音楽動画の生成を行う.また,本システムによる生成動画の評価も行った.
著者
大矢 隼士 森島 繁生
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2012-MUS-95, no.10, pp.1-6, 2012-05-26

インターネットの動画共有サイト上に存在するアマチュア制作の音楽動画を再利用することにより,自動的に音楽動画を生成するシステムを提案する.この音楽動画は,既存の音楽にゲームやアニメなどの映像を切り貼りして制作されたものであり,MAD 動画と呼ばれている.本稿では,以前筆者らグループが提案した DanceReProducer の学習手法を,マルコフ連鎖を使うことにより映像の時系列情報を考慮できるように改善し,Forward Viterbi アルゴリズムを用いて動画生成をおこなう.提案システムは,まずインターネット上にアップロードされている MAD 動画を大量に取得し,データベースとする.その後,データベースの動画から音楽特徴量,映像特徴量を抽出し一小節ごとにまとめ,楽曲の構造情報やテンポの推定をおこなう.次に,各特徴量をクラスタリングし,状態変数を音楽特徴量,潜在変数を映像特徴量として,潜在変数のマルコフ連鎖モデルを使用して学習する.動画の生成は,任意の楽曲 (入力楽曲) に対し,学習した同調関係から最も入力楽曲と同調する映像をデータベースから選び出し,切り貼りすることで新しい動画を自動的に生成している.