事前学習したvq-wav2vecの音声特徴表現を用いたボコーダフリーのAny-to-Many音声変換

6 0 0 0 OA 事前学習したvq-wav2vecの音声特徴表現を用いたボコーダフリーのAny-to-Many音声変換

著者: 越塚毅大村英史桂田浩一
雑誌: 研究報告音声言語情報処理(SLP) (ISSN:21888663)
巻号頁・発行日: vol.2021-SLP-136, no.39, pp.1-6, 2021-02-24

音声変換は,入力された音声に対して言語情報を保持しつつ,話者性などの非言語情報のみを変換する技術である.一般的に,音声から話者性を除去するEncoderと,別話者の情報を加えるDecoderから構成されるシステムが多い.本稿では,事前学習した vq-wav2vecをEncoderに用いたボコーダフリーのAny-to-Many音声変換モデルを提案する.提案モデルでは Encoder の事前学習に加えて,RNN_MS と同様の構造を持つDecoderも事前学習することによって,少量の学習データからの音声変換を実現している.このように Encoder および Decoderを事前学習することにより学習データ量を削減する方法は既に提案されているが,Any-to-Many音声変換を対象としている点,およびDecoderの事前学習を音声変換タスクによって行う点が異なる.音声変換の精度を評価したところ,良好な音声変換精度が得られることが確認できた.また,既に学習済みのターゲット話者に対する変換精度を損なうことなく新たなターゲット話者を追加できることが確認できた.

2021-03-05 00:06:18
6 + 17 Twitter

http://id.nii.ac.jp/1001/00209675/

言及状況

Twitter (6 users, 7 posts, 17 favorites)

音声研究会で発表してきた「事前学習したvq-wav2vecの音声特徴表現を用いたボコーダフリーのAny-to-Many音声変換」 https://t.co/wG4WijHCgz

5 @pieorpi1 @vmpmember @hpp_ricecake @SythonUK @ballforest

12 @nena_undefined @ShigekiKarita @mulgray @gontani @vinami @heiga_zen @ml_taro @tarepan_mhhow @hpp_ricecake @r9y9 @vstcpp @Yoshizou301

事前学習したvq-wav2vecの音声特徴表現を用いたボコーダフリーのAny-to-Many音声変換　https://t.co/nhycaP37FD

5 @zukky_rikugame @KentaroTachiba @tarepan_mhhow @morioka @y_chu5

6 0 0 0 OA 事前学習したvq-wav2vecの音声特徴表現を用いたボコーダフリーのAny-to-Many音声変換

言及状況

Twitter (6 users, 7 posts, 17 favorites)

収集済み URL リスト