著者
木村 優志 春日 秀之
雑誌
研究報告音声言語情報処理(SLP) (ISSN:21888663)
巻号頁・発行日
vol.2020-SLP-134, no.34, pp.1-4, 2020-11-25

コンピューターグラフィックスで作られた外見で動画配信を行う Virtual Youtuber (VTuber / バーチャルライバー) や,Virtual Influencer と呼ばれる存在が近年注目されている.CG による固有の外観をもっているが,声に関しては声優などが務めることが多い.ここで,バーチャルタレントの外見だけではなく,話者変換によって声を変えることができればより便利である.StarGAN-VC2++ は高精度な話者変換モデルの一つであるが,基本周波数が振動するという問題がある.そこで,新たに Δ????0 損失項を導入し,基本周波数の振動の抑制を試みる.実験の結果,基本周波数の振動の抑制が確認された.しかし,フィルタが発振する例が見られる問題が残る.