著者
石先広海 舟澤慎太郎 帆足啓一郎 小野 智弘 甲藤二郎
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.54, no.4, pp.1263-1274, 2013-04-15

本研究ではユーザが入力した楽曲に対して,楽曲の歌詞に基づいて検索したWeb画像と楽曲を同期させて再生するスライドショー生成システムについて提案する.楽曲歌詞の内容に適した画像を楽曲と同期させて再生することで,楽曲の情景表現を向上させ,より印象深い音楽体験の実現を目指す.具体的には,歌詞中の単語と,歌詞から推定した全体印象語から最適な画像検索クエリを抽出し,表示候補となる画像をWeb上から取得する.取得した画像に付与されているソーシャルタグと全体印象語の適合度を用いることで,歌詞の各行と連動して表示させる画像を選定する.さらに,歌詞の各行を表示する時間の最頻値を利用してスライドショー再生時の画像切替えを自動化する.最終的に,被験者評価実験により本システムの有効性を示す.
著者
石先広海 舟澤慎太郎 帆足啓一郎 小野 智弘 甲藤二郎
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.54, no.4, pp.1263-1274, 2013-04-15

本研究ではユーザが入力した楽曲に対して,楽曲の歌詞に基づいて検索したWeb画像と楽曲を同期させて再生するスライドショー生成システムについて提案する.楽曲歌詞の内容に適した画像を楽曲と同期させて再生することで,楽曲の情景表現を向上させ,より印象深い音楽体験の実現を目指す.具体的には,歌詞中の単語と,歌詞から推定した全体印象語から最適な画像検索クエリを抽出し,表示候補となる画像をWeb上から取得する.取得した画像に付与されているソーシャルタグと全体印象語の適合度を用いることで,歌詞の各行と連動して表示させる画像を選定する.さらに,歌詞の各行を表示する時間の最頻値を利用してスライドショー再生時の画像切替えを自動化する.最終的に,被験者評価実験により本システムの有効性を示す.In this paper, we propose a system to generate slide shows for music which users selected, by utilizing Web images retrieved by queries constructed from song lyrics. The proposed system aims to provide new and impressive user experiences by using synchronized Web images with lyrics line. First, we propose a method to select images to compose the slideshow from the result of Web image retrieval based on queries extracted from lyrics. The system selects matched images with the whole impression of lyrics and removes images which have many social tags not related to the image content. Furthermore, we propose a method to adjust presentation periods of the images in the slides. Finally, subjective experiments are conducted to evaluate effectiveness of our system.
著者
舟澤慎太郎 北市 健太郎 甲藤二郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告オーディオビジュアル複合情報処理(AVM) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.22, pp.1-5, 2008-03-06
被引用文献数
1

本稿では,楽曲の音響的特徴と歌詞情報を利用した類似楽曲検索手法を述べる.典型的なContent-based楽曲検索において,楽曲の特徴はベクトルで表現され,それらの類似度を基に検索をする.この際に,楽曲の特徴ベクトルを構成する要素には,"ユーザが楽曲から受ける印象に影響を与える特徴量"を用いることで,対応できる検索要求の幅を広げ,検索精度の向上につながる.そこで本稿では,楽曲波形から得られる音響的特徴量に加えて,歌詞情報を特徴量として利用する.そして,ユーザによる評価実験を行い,この手法の有効性を評価した.This paper presents similar music retrieval that uses acoustic features and lyrics features of musical pieces. In typical content-based music retrieval, the features of music pieces are expressed by vectors, and music pieces are retrieved based on their similarities. When generating the features vectors, using "features that influence impression that users receive from music" as elements improves retrieval accuracy. Therefore, in this paper, we use lyrics features in addition to acoustic features that are extracted from music signals. Furthermore, we estimate the efficacy of this music retrieval method by a subjective evaluation experiment.
著者
佃 卓磨 甲藤二郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.14, pp.39-44, 2002-02-15

学習波形データをwavelet変換しその周波数分布を誤差逆伝搬で学習させる効率のよい方法を検討する。出力層と目標値を勝者ユニット方式で音源識別できるように設定し,結合係数を目標値に合わせて制御するリセットアルゴリズムを提案する。その結果,1回の誤差逆伝搬の計算量は増えるが全体の学習効率は向上することが示せた。また単音学習させたものを和音に適用させ,認識率と処理速度が向上する方法を検討する。2和音から1音をNeural Networkで識別し,仮音源分離を行い残りの1音を識別するアルゴリズムを提案する。その結果,音源同定の認識率は向上し,処理速度も向上することが示せた。In this paper, we investigate an effective learning way for back propagation using frequency spectrums which are transformed from PCM data with wavelet transform. We suggest a winner unit algorithm that output layers and target values are set so as to identify a sound source, and a reset algorithm that coupling coefficient is controlled according to the target values. As a result, we have confirmed that the total learning efficiency is improved though the calculated amount for each back propagation step increases slightly. We also investigate a way that improves the recognition rate and the processing speed by applying Neural Network learned with single sound waves to choral sound waves. We suggest an algorithm that Neural Network identifies a single sound wave from mixed two sound waves, and after one wave is separated from the mixed wave, the other wave is identified by the same Neural Network. As a result, we have confirmed that the recognition rate of the sound source identification and the processing speed are improved.
著者
鈴木 惇也 板垣 秀星 境田 慎一 井口 和久 甲藤二郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告オーディオビジュアル複合情報処理(AVM) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.125, pp.51-56, 2007-12-13
被引用文献数
4

本稿では、デコーダに付加情報を与えて復号画像の画質改善を行う動画像符号化方式に関する検討を行なう。はじめに、一枚の静止画像を互いに独立に符号化し、その復号画像を重ね合わせることによる量子化誤差の低減効果を示し、次に、その効果の動画像符号化への応用として、デコーダに補助情報として符号化規格を超える精度の動きベクトルを与えることによる符号化画質改善手法を提案する。さらに、エンコーダでのベクトル検出条件と動き補償・合成の参照画像について改善を加えた動画像符号化方式を提案し、画質改善効果と圧縮効率の向上を ITE 標準動画像を用いた実験によって示す。This paper presents a new video coding method which improves PSNR of decoded pictures by using additional information. Firstly, we show a pixel shift effect which brings PSNR improvement by composing multiple compressed images extracted from an original image and, as an application of the pixel shift effect, we then propose a video coding method which sends higher precision motion vectors to a decoder as additional information. We especially focus on how to select effective motion vectors at an encoder and how to decide mixture of decoded pictures for improving PSNR. Finally, we show experimental results that present improving R-D characteristics of H.263+.