著者
戸田 智基
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.108, no.422, pp.73-78, 2009-01-22

声質変換は,言語情報を保存したまま話者性等の非言語情報を変換する技術である.従来の統計的手法に基づく枠組みでは,入力話者と出力話者が同一内容を発声しているパラレルデータを数十文程度用いて,特定話者対を対象とした変換モデルを事前に学習する必要がある.我々は,この制約を大きく緩和する枠組みとして,任意の話者を対象とした声質変換技術の研究開発に取り組んでいる.多数の異なる話者の音声データを有効利用することで,任意の話者からある特定の話者への変換(多対一声質変換)と,ある特定の話者から任意の話者への変換(一対多声質変換)が可能となる.本報告では,これらの変換を実現する技術について紹介する.

言及状況

Twitter (1 users, 1 posts, 3 favorites)

その後これにあたって参考文献を漁るという。 / 任意の話者を対象とする統計的声質変換・制御法 http://t.co/qaTjAJRXrH

収集済み URL リスト