著者
永野 秀尚 柏野 邦夫 村瀬 洋
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.82, pp.67-72, 2001-08-04
被引用文献数
2

本稿では、音や映像のメディア探索のための曖昧文字列照合法を提案し その類似音楽検索への適用を検討する. ここで類似音楽検索とは多重奏音楽の音響信号を検索キーとして 長時間の音楽から検索キーに類似する部分を探索することである. この探索においては 信号間の類似度と信号の伸縮を考慮しなければならないことと 探索に時間がかかることが問題である. そこで 符号間の類似度を表現する類似度行列を導入し これに基づき符号系列化された信号間で 伸縮を考慮した探索を 類似度行列のスパース性により高速に行う曖昧文字列照合法を提案し この類似音楽検索に適用した. 30曲の類似音楽サンプル用いた予備実験では 曖昧文字列照合法により 従来のDPマッチングを用いたずらし照合法と比べ 約4倍高速な探索が行えた.We propose a Similarity-Based String Matching method for media information retrievaland its application to similar-music retrieval.The media information retrieval is here defined as detecting all the segments that are similar to a specified audio or video segments on a long audio or video stream. In such a task, we must consider similarities between features, deal with temporal stretching or shrinking, and also realize quick searching. Thus, the proposed method introduces a similarity matrix with a similarity enhancement technique and the DP matching method with a newly developed acceleration technique. Experiments using 30 similar-music pieces show that the proposed method can retrieve similar music fragments approximately four times faster than the conventional DP matching method, maintaining the same accuracy.
著者
永野 秀尚 柏野 邦夫 村瀬 洋
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.86, no.11, pp.1657-1667, 2003-11-01
被引用文献数
1

本論文では,多重奏音響信号をクエリーとして多重奏音響信号から類似する音楽を探索する類似音楽探索法とその高速化手法を提案する.本類似音楽探索においては多重奏音響の類似性に基づいた探索を高速に行う必要がある.そこで,まず,多重奏において同時に発生する複数の音の有無に着目した2値多重音響特徴ベクトルを提案する.本特徴は多重奏音響信号の類似性に基づいた高速探索に適している.そして更に,本特徴を用いた探索における高速化手法を導入する.本手法は類似度行列のスパース化により探索空間を制限し,より高速な探索を行う.216曲の実験用音楽データベースを用いた探索実験では,例えば,楽曲単位の探索において,クエリーの長さが平均19秒のとき,スペクトル特徴を用いた場合に62.5%であった精度が,提案の2値多重音響特徴ベクトルを用いることにより89.3%にまで向上した.また,本高速化手法においては,精度をほとんど損なわずに,DP照合を用いたずらし照合法に比べ約1.6倍から18倍の高速化を達成した.
著者
大石康智 亀岡 弘和 持橋 大地 永野 秀尚 柏野 邦夫
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.9, pp.1-8, 2010-07-21
被引用文献数
1

本報告では,歌声のF0動特性をノート単位で編集し,歌い方を多様に変形できる歌声合成インタフェースの実現を目指し,その動特性のモデリングとモデルパラメータ推定に関する新しい解法を提案する.F0動特性は線形2次系に従うと仮定し,その生成過程を完全に確率モデルとして表現する.そして,EM法に基づいて,効率的なモデルパラメータ最適化アルゴリズムを導出する.最終的に,推定された2次系の振動を制御するパラメータと各ノートの音高を表すパラメータを個別に操作し,生成されたF0系列に基づいて歌声音響信号を変形して合成する"Vocal Dynamics Controller"を実装する.We present a novel statistical model for dynamics of various singing behaviors, such as vibrato and overshoot, in a fundamental frequency (F0) sequence and develop a note-by-note editing and synthesizing interface for F0 dynamics. We develop a complete stochastic representation of the F0 dynamics based on a second-order linear system and propose a complete, efficient scheme for parameter estimation using the Expectation-Maximization (EM) algorithm. Finally, we synthesize the singing voice using the F0 sequence generated by manipulating model parameters individually which control the oscillation based on the second-order system and the pitch of each note.
著者
北原 鉄朗 永野 秀尚
雑誌
情報処理
巻号頁・発行日
vol.57, no.6, pp.504-505, 2016-05-15
著者
村田 眞哉 永野 秀尚 川西 隆仁 平松 薫 柏野 邦夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.114, no.521, pp.245-249, 2015-03-12

本論文では特定物体が映る画像をクエリとして,映像中からその特定物体を探索するタスクに対する我々の探索法を説明する.その際画像クエリ内の特定物体の領域を示す注目領域情報(region-of-interest, ROI)も同時に入力されることを想定し,その効果的な使用法を提案する.提案法は検索結果のリランキングになっており,ROI内の画像特徴のみを使用した検索結果ランキングの上位K件を,ROI外の特徴でリランキングする.これにより特定物体の背景情報(ROI外の特徴)によるトピックドリフトをある程度防ぐことができ,背景情報を特定物体の情報と同時に使用する従来法と比べて探索精度の改善が期待できる.実際、TRECVIDのインスタンスサーチタスクのデータセットを使用した実験により、提案法の探索精度が従来法の探索精度より高いことを確認した。
著者
永野 秀尚 柏野 邦夫 村瀬 洋
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.5, pp.1179-1188, 2004-05-01
被引用文献数
6

音声が音楽に重畳した音響信号(蓄積信号)中から,参照信号として与えられた音楽が音声の背景に含まれる区間(目的区間)を見つけ出すことを背景音楽探索と呼ぶ.本論文では,この背景音楽探索を高速に行う手法について述べる.背景音楽探索では,探索の目的となる目的区間においても,他の音声の重畳により,その音響信号は参照信号と著しく異なり,参照信号を蓄積信号と直接照合する手法での探索は困難である.そこで,参照信号のスペクトログラムを時間周波数領域において多数の小領域に分割し,これらの小領域スペクトログラムと類似度の高い小領域スペクトログラムをもつ時点を蓄積信号のスペクトログラムから探索し,その探索結果を統合することで,目的区間を探索する手法を提案する.本手法は,参照信号の各小領域スペクトログラムと類似度の高い小領域スペクトログラムのみを,蓄積信号のスペクトログラムから,高速な探索手法を用いて探索することで,背景音楽探索全体を高速に行うことを特徴とする.実験では,各小領域スペクトログラムの探索に時系列アクティブ探索法(TAS)を用いることで,約30分の蓄積信号からの15秒の目的区間の背景音楽探索を1秒未満で行うことができた.