- 著者
-
戸上 真人
- 雑誌
- 研究報告音声言語情報処理(SLP) (ISSN:21888663)
- 巻号頁・発行日
- vol.2021-SLP-136, no.8, pp.1-6, 2021-02-24
深層学習ベースの音源分離の進化が著しいが,ニューラルネットワーク (NN) は空間モデルとは独立に学習されることが多い.しかし,そのような構成で学習された NN は,空間モデルを用いて音源分離を行う構成において本当に最適であるといえるのかという疑問が残る.本講演では従来の統計モデルに基づく音源分離および深層学習を用いた音源分離の研究の流れを示すと共に,深層学習を用いた音源分離に空間モデルを取り込み,NN を空間モデルを考慮して学習する方法として近年著者らが進めている 4 つの方向性,1) 空間モデルの影響を考慮した NN の損失関数,2) NN の構造の中に空間モデルを用いた音源分離を埋め込む方法,3) 所望音源の到来方向の情報をアトラクタとして用いて音源分離に必要なパラメータを推定するフレームワーク,4) 統計モデルに基づく音源分離法を疑似教師信号生成機として用いる教師無し NN 学習法を紹介する.