著者
中野 允裕 ルルージョナトン 亀岡 弘和 中村 友彦 小野 順貴 嵯峨山 茂樹
雑誌
研究報告音楽情報科学(MUS)
巻号頁・発行日
vol.2011, no.6, pp.1-8, 2011-07-20

本報告では,音楽信号のような多重音を解析するための手法として,Bayesian nonparametrics に基づく音響信号スペクトログラムのモデル化方法を提案し,その構成法と推論について議論する.近年,非負値行列分解に代表されるようなスパース表現基づく音楽信号のモデル化が盛んに研究されている.その中で解決すべき二つの問題が注目を集めている.一つ目は楽器音が時間変化する多様なスペクトルを持つ点であり,もう一点は観測信号中に含まれる音源の数が一般的には未知なことである.さらに,楽器音の多様なスペクトルは音源数の推定を困難にし,また逆に音源数が未知であることによって一音一音がどの程度多様なスペクトルを持つか推定することを困難にしている.本報告では,これら二つの課題を同時に解消するために,信号の重畳を表す非負値行列分解型のスパース表現と時系列パターンを表現する隠れマルコフモデルを Bayesian nonparametrics 上で融合させたスペクトログラムモデルを提案する.This paper presents a Bayesian nonparametric latent source discovery method for music signal analysis. Recently, the use of latent variable decompositions, especially nonnegative matrix factorization (NMF), has been a very active area of research. These methods are facing two, mutually dependent, problems: first, instrument sounds often exhibit time-varying spectra, and grasping this time-varying nature is an important factor to characterize the diversity of each instrument; moreover, in many cases we do not know in advance the number of sources. Conventional decompositions generally fail to cope with these issues as they suffer from the difficulties of automatically determining the number of sources and automatically grouping spectra into single events. We address both these problems by developing a Bayesian nonparametric fusion of NMF and hidden Markov model (HMM).