著者
能勢 隆 山岸 順一 小林 隆夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.105, no.572, pp.61-66, 2006-01-20
参考文献数
8

本論文では, 隠れマルコフモデル(HMM)に基づく音声合成システムにおいて, 複数の発話様式または感情表現の表出や強調の度合を制御することを目的に, 重回帰モデルを用いた音声のスタイル制御法を提案する. 従来の重回帰HMMを用いた手法では, 音声の重要な特徴の一つである音韻継続長を担う明示的なパラメータが存在しないため, 各発話様式・感情表現を個別にモデル化した場合に比べ, 再現性が低下するという問題があった. そこで提案法では, HMMに状態継続長分布を組み込んだ隠れマルコフモデル(HSMM)を用いることで音韻継続長を明示的な制御の対象としている. 主観評価試験により, 提案法は各発話様式・感情表現の再現性だけでなく, これらの表出・強調度合の制御においても, 従来の重回帰HMMを用いた手法より優れていることを示す. また, 発話様式・感情表現の制御法の一つである補間手法との比較や, 重回帰HSMMで用いるスタイル空間の違いが合成音声に与える影響についても検討を行っている.

言及状況

Twitter (5 users, 5 posts, 7 favorites)

音声合成における感情表現・発話様式(スタイル)の制御について初めて発表したのはもう10年以上前になります。重回帰隠れセミマルコフモデルとスタイルベクトルにより複数スタイルの直観的制御を実現しました。今でも受けの良いデモの一つです。https://t.co/rUKeknXwVk https://t.co/sEu1IBGO88

収集済み URL リスト