著者
金川 裕紀 能勢 隆 小林 隆夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.111, no.364, pp.191-196, 2011-12-12
参考文献数
22

本論文では隠れマルコフモデル(HMM)に基づく音声合成において,目標話者の読上げスタイルの音声のみから異なる目標スタイルの音声を生成する手法を提案する.従来,読上げスタイルモデルから少量の目標スタイル音声を用いてスタイル適応を行うことにより目標スタイルの任意の文章を合成する手法が提案されているが,目標スタイルの音声が得られない場合にはこの手法を利用することはできない.提案法では,あらかじめ複数の話者により学習された読上げスタイルモデルに対し,同じ話者による目標スタイルへのスタイル変換を線形変換により表現する.これにより得られる変換行列は特定の話者に依存しない不特定話者のスタイル変換を表すため,これを目標話者の読上げスタイルモデルに適用することで目標話者の目標スタイル音声が利用できない場合についてもスタイル音声の合成が可能となる.評価実験では変換後の合成音声について話者性,スタイル再現性および自然性の3つの観点から提案法の有効性を検討する.

言及状況

Twitter (1 users, 1 posts, 0 favorites)

収集済み URL リスト