著者
橘 秀幸 小野 順貴 嵯峨山 茂樹
出版者
情報処理学会
雑誌
研究報告音楽情報科学(MUS) (ISSN:09196072)
巻号頁・発行日
vol.2009, no.12, pp.1-6, 2009-07-22

本稿では,歌声と楽器音を両方含むような音楽音響信号から,歌声成分を強調,または抑圧する信号処理手法について述べる.歌声に相当する成分を検出するために,本稿ではスペクトルの時間変化に由来するスペクトログラムの特徴的な形状に着目する.歌声にはスペクトルの時間変化や旋律的な動きがあるため,スペクトルの形状が長時間一定であることはなく,またこれらの時間変化の影響で歌声のスペクトルは周波数軸方向にある程度の幅を有するという点で特徴的である.このような特徴をスペクトログラムの異方性という観点から捉えると,歌声と楽器音の滑らかさは異方的であり,異方的な信号を分離する手法を使って歌声と伴奏を分離することができる。本稿ではそのような手法を具体的に提案し,実際の音楽信号を用いた実験を行った結果,聴感上,歌声成分が強調/抑圧された信号が得られることを確認した.We address a problem of enhancing or suppressing singing voice components in music audio signals. To achieve the purpose, we focus on peculiar spectral shapes of singing voice: they are not maintained unchanged for a while, and they occupy broad bandwidth, both of them is caused by spectral fluctuations and melodic nature of singing voice. When we regard those characteristic shapes as anisotropic smoothness of spectrogram, we can separate a music into singing voice and accompaniment, by applying a method which separates a signal into anisotropic components. In this paper, we propose a signal processing algorithm to enhance/suppress singing voice, based on those natures of spectral shapes of singing voice. We also conducted an auditory evaluation to confirm the effectivenes of the method using real music audio signals.