- 著者
-
後藤 真孝
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
- 巻号頁・発行日
- vol.84, no.1, pp.12-22, 2001-01-01
- 被引用文献数
-
40
本論文では, 複数の楽器音が混在したモノラルの音楽音響信号に対して, メロディーとベースの音高(基本周波数)を推定する手法を提案する.従来の音高推定手法や音源分離手法は, たかだか三つの音の混合音しか扱うことができず, 市販のCDによるジャズやポピュラー音楽の音響信号には有効に機能しなかった.本手法は, 混合音下で安定に抽出できない基本周波数成分には依存せず, 意図的に制限した周波数帯域(メロディーは中高域, ベースは低域)にある高調波成分が支持する最も優勢な音高を求める.その際, 音源数を仮定せずにあらゆる音高の高調波構造が混在しているとみなして混合音をモデル化し, EM(Expectation-Maximization)アルゴリズムにより各高調波構造が相対的にどれくらい優勢かを推定する.更に, マルチエージェントモデルを導入し, 各エージェントが音高の時間的な軌跡を追跡することで, 最も優勢で安定な音高の軌跡を得ることができる.本手法に基づくシステムを実装して実験した結果, 市販のCDからサンプリングした実世界の音響信号に対し, メロディーとベースの音高をリアルタイムに推定できることを確認した.