- 著者
-
戸田 智基
大谷 大和
鹿野 清宏
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
- 巻号頁・発行日
- vol.106, no.221, pp.25-30, 2006-08-23
- 被引用文献数
-
2
声質変換(Voice Conversion: VC)の新しい枠組みとして,固有声に基づく声質変換法(Eigenvoice Conversion: EVC)を提案する.本報告では,ある特定の話者から任意の話者への変換(一対多VC),および任意の話者からある特定の話者への変換(多対一VC)に対してEVCを適用する.EVCでは,予め収録された多数話者によるパラレルデータを用いて,固有声混合正規分布モデル(Eigenvoice Gaussian Mixture Model: EV-GMM)を事前に学習する.EV-GMMは出力(多対一VCでは入力)音声の声質を制御する少量のフリーパラメータを持つ.所望の話者に対する変換モデルは,その話者の音声データに対してフリーパラメータを最尤推定する事で構築される.この際に,発話内容に関する情報は一切使用しないため,完全な教師なしモデル適応が実現される.さらに,一対多VCにおいては,フリーパラメータを声質制御イコライザーとして用いることで,出力変換音声の声質を手動で制御する事も可能である.一対多VCおよび多対一VCにおいて実験的評価を行った結果,EVCでは所望の話者の音声データが2文程度あれば,高い変換精度が得られる事が分かった.