著者
内田 伸哉 菅野 真音 長井 隆行 池原 雅章
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. WBS, ワイドバンドシステム (ISSN:09135685)
巻号頁・発行日
vol.105, no.176, pp.19-24, 2005-07-07

本論文は混合音声の音源分離について逆行列を使用した方法を提案する.まず, この手法を満たすための仮定であるW-disjoint orthogonalityについて述べ, ステレオ録音された各音声データは, それ特有の位相と振幅の比の値を持ち, それがオリジナルの音声ソースが不明な状態からの元信号探索に有効であることを示す.次に, 従来法であるDUETについて述べ, 振幅遅延表現のヒストグラムを作成することにより, 個々の音声ソースがピークを持ちそれぞれ独立の位相振幅成分を有することを確認する.最後に逆行列を使用して音源分離を行う方法についてシミュレーションを行い従来法と比較をし, その有用性を示す.

言及状況

Twitter (2 users, 2 posts, 0 favorites)

@yoching このへんかなーhttp://ci.nii.ac.jp/naid/110003224584/ 雑音に対してのSN比によりけりかもですが、雑音区間/音声区間の分離はできると思う。ただ人の声らしさって評価関数を正しく設定できるかはちょっと知識不足

収集済み URL リスト