著者
平井 龍之介 齋藤 佑樹 猿渡 洋
雑誌
研究報告音声言語情報処理(SLP) (ISSN:21888663)
巻号頁・発行日
vol.2023-SLP-146, no.11, pp.1-8, 2023-02-21

本稿では,連合学習を用いたユーザ参加型の多対多声質変換モデル学習法を提案する.従来の多対多声質変換技術は,多数話者の音声を含むデータセットを用いて声質変換モデルを学習する.しかし,学習されたモデルが多種多様なユーザによる入力音声に対して高品質な声質変換を実現する保証はない.提案手法では,高品質な多対多声質変換を実現する StarGANv2-VC モデルを研究開発者とユーザが協同的に学習し,ユーザが所有する音声データのプライバシーを保護しながら,より多様な話者の音声を変換可能な深層学習モデルを構築する.実験的評価の結果より,提案手法が従来の非分散型学習法と同程度の話者類似性を達成しうることを示す.

言及状況

Twitter (2 users, 2 posts, 2 favorites)

収集済み URL リスト