- 著者
-
北条 伸克
亀岡 弘和
嵯峨山 茂樹
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
- 巻号頁・発行日
- vol.113, no.308, pp.13-18, 2013-11-14
本稿は,高品質なテキスト音声合成を目指し,複合ウェーブレットモデル(composite wavelet model; CMW)と隠れマルコフモデル(hidden Markov model; HMM)の統合モデルに,フォルマント周波数軌跡のモデルを組み込む.ケプストラム特徴量による従来のHMM音声合成方式では,モデル学習時におけるケプストラム特徴量の平均化がスペクトルの周波数方向の平滑化の原因となり,一般にbuzzyな合成音声へ劣化する原因となった.これに対し,フォルマント周波数に相当する特徴量の平均化はスペクトルの平滑化をもたらさないと期待される.このような観点から,我々は,CWMとHMMの統合モデルによる音声合成方式を過去に提案した.一方で,従来のCWMとHMMの統合モデルは,スペクトル系列の区分定常な生成モデルであり,ダイナミクスのモデル化に課題があった.本稿は,CWMがフォルマント周波数に相当するパラメータを持つことに着目し,フォルマント周波数軌跡の生成モデルをCWMとHMMの統合モデルに組み込み,スペクトル系列のダイナミクスをモデル化する.本稿では,実験を通して提案モデルがフォルマント周波数軌跡を十分に推定することを定性的に確認した.