著者
戸上 真人
出版者
一般社団法人 電子情報通信学会
雑誌
電子情報通信学会 基礎・境界ソサイエティ Fundamentals Review (ISSN:18820875)
巻号頁・発行日
vol.16, no.4, pp.257-271, 2023-04-01 (Released:2023-04-01)
参考文献数
132

複数の音が混ざった音を音源ごとに分離する音源分離技術は,無線通信のビームフォーミング技術,確率モデルに基づく信号処理及び最適化に関する技術,そして深層学習に関する技術を取り込みつつ進化を続けてきている.本稿では,空間モデルと音源の確率モデルに基づく複数マイクロホンの音源分離技術,深層学習を用いた単一マイクロホンの音源分離技術,そして深層学習ベースの音源モデルと空間モデルを用いた複数マイクロホンの音源分離技術の概観を示す.
著者
戸上 真人
雑誌
研究報告音声言語情報処理(SLP) (ISSN:21888663)
巻号頁・発行日
vol.2021-SLP-136, no.8, pp.1-6, 2021-02-24

深層学習ベースの音源分離の進化が著しいが,ニューラルネットワーク (NN) は空間モデルとは独立に学習されることが多い.しかし,そのような構成で学習された NN は,空間モデルを用いて音源分離を行う構成において本当に最適であるといえるのかという疑問が残る.本講演では従来の統計モデルに基づく音源分離および深層学習を用いた音源分離の研究の流れを示すと共に,深層学習を用いた音源分離に空間モデルを取り込み,NN を空間モデルを考慮して学習する方法として近年著者らが進めている 4 つの方向性,1) 空間モデルの影響を考慮した NN の損失関数,2) NN の構造の中に空間モデルを用いた音源分離を埋め込む方法,3) 所望音源の到来方向の情報をアトラクタとして用いて音源分離に必要なパラメータを推定するフレームワーク,4) 統計モデルに基づく音源分離法を疑似教師信号生成機として用いる教師無し NN 学習法を紹介する.
著者
川口 洋平 戸上 真人
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 A (ISSN:09135707)
巻号頁・発行日
vol.J95-A, no.2, pp.217-221, 2012-02-01

3話者間会話が存在する場合に会話ごとに話者をクラスタリングする手法を提案する.提案手法は発話権交替をモデル化した隠れマルコフモデルの照合により実現される.実験により提案手法が効果的であることが示唆された.