- 著者
-
戸田 智基
徳田 恵一
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
- 巻号頁・発行日
- vol.105, no.253, pp.1-6, 2005-08-19
HMMに基づく音声合成方式では, あらかじめ音声パラメータ系列をモデル化するHMMを学習しておき, 合成時には入力テキストに対応するHMMから尤度最大化基準により音声パラメータを生成する.静的・動的特徴量間の明示的な制約条件を導入することで, 適切な遷移を満たすパラメータ系列の生成が可能となり, 不連続感の少ない滑らかで安定した合成音声が得られる.一方で, 音声信号がもつ詳細な特徴は統計処理により失われるため, 生成されるパラメータは過剰に平滑化されたものとなり, 合成音声の肉声感は大きく損なわれる.本稿では, 音響モデリングで失われる特徴量の一つとして, パラメータ系列全体における変動量に着目し, 従来考慮されている静的・動的特徴量に対する尤度のみでなく, 系列内変動に対する尤度も考慮した音声パラメータ生成アルゴリズムを提案する.新たに導入される尤度は, 従来法において顕著にみられる生成パラメータの系列内変動の減少を抑える働きをする.実験的評価結果から, 提案法により合成音声の自然性は大幅に改善されることを示す.