著者
田村 正統 益子 貴史 徳田 恵一 小林 隆夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.85, no.4, pp.545-553, 2002-04-01
被引用文献数
19

本論文では,不特定話者の音声合成単位である"平均声"モデルから,任意話者の特徴をもつ音声を合成する手法を提案する.提案手法は,HMMに基づくテキスト音声合成システムに基づいている.HMMに基づく音声合成システムでは,多空間上の確率分布(MSD)に基づくHMMを用いてスペクトル及びピッチパラメータを同時にモデル化しており,HMMのパラメータを適切に変換することにより合成音声の声質や韻律特徴を変換できる.本論文では,MLLRアルゴリズムをMSD-HMMに拡張し,ピッチ及びスペクトルモデルの話者適応を行うことにより,目標話者の少量の文章を用いて,声質のみでなく韻律情報も適応できることを示す.主観評価試験により,ピッチ及びスペクトルを同時に話者適応することにより,平均声モデルを数文章で適応したモデルから,特定話者モデルからの合成音声に近い音声を合成できることを示した.

言及状況

Twitter (1 users, 1 posts, 0 favorites)

こんな論文どうですか? HMMに基づく音声合成におけるピッチ・スペクトルの話者適応(田村正統ほか),2002 http://id.CiNii.jp/NWXVL

収集済み URL リスト