文献一覧: 戸上真人 (著者)

32 0 0 0 OA 音源分離技術の基礎と動向 ―確率モデル/深層学習に基づく方法の概観―

著者: 戸上真人
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会基礎・境界ソサイエティ Fundamentals Review (ISSN:18820875)
巻号頁・発行日: vol.16, no.4, pp.257-271, 2023-04-01 (Released:2023-04-01)
参考文献数: 132

複数の音が混ざった音を音源ごとに分離する音源分離技術は,無線通信のビームフォーミング技術,確率モデルに基づく信号処理及び最適化に関する技術,そして深層学習に関する技術を取り込みつつ進化を続けてきている.本稿では,空間モデルと音源の確率モデルに基づく複数マイクロホンの音源分離技術,深層学習を用いた単一マイクロホンの音源分離技術,そして深層学習ベースの音源モデルと空間モデルを用いた複数マイクロホンの音源分離技術の概観を示す.

1 0 0 0 OA 空間モデルを考慮した深層学習ベースの音源分離

著者: 戸上真人
雑誌: 研究報告音声言語情報処理(SLP) (ISSN:21888663)
巻号頁・発行日: vol.2021-SLP-136, no.8, pp.1-6, 2021-02-24

深層学習ベースの音源分離の進化が著しいが,ニューラルネットワーク (NN) は空間モデルとは独立に学習されることが多い.しかし,そのような構成で学習された NN は,空間モデルを用いて音源分離を行う構成において本当に最適であるといえるのかという疑問が残る.本講演では従来の統計モデルに基づく音源分離および深層学習を用いた音源分離の研究の流れを示すと共に,深層学習を用いた音源分離に空間モデルを取り込み,NN を空間モデルを考慮して学習する方法として近年著者らが進めている 4 つの方向性,1) 空間モデルの影響を考慮した NN の損失関数,2) NN の構造の中に空間モデルを用いた音源分離を埋め込む方法,3) 所望音源の到来方向の情報をアトラクタとして用いて音源分離に必要なパラメータを推定するフレームワーク,4) 統計モデルに基づく音源分離法を疑似教師信号生成機として用いる教師無し NN 学習法を紹介する.

2021-03-03 20:38:54
1 + 5 Twitter

http://id.nii.ac.jp/1001/00209644/

1 0 0 0 発話権交替モデルの照合に基づく会話クラスタリング

著者: 川口洋平戸上真人
出版者: The Institute of Electronics, Information and Communication Engineers
雑誌: 電子情報通信学会論文誌 A (ISSN:09135707)
巻号頁・発行日: vol.J95-A, no.2, pp.217-221, 2012-02-01

3話者間会話が存在する場合に会話ごとに話者をクラスタリングする手法を提案する.提案手法は発話権交替をモデル化した隠れマルコフモデルの照合により実現される.実験により提案手法が効果的であることが示唆された.

2012-10-31 17:52:08
1 + 1 Twitter

http://search.ieice.org/bin/summary.php?id=j95-a_2_217&category=A&year=2012&lang=J&abst=