著者
ニック キャンベル
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.98, no.423, pp.47-54, 1998-11-19

CHATRは音声コーパスを用いて音声合成を生成する手法である。本手法は信号処理を施すことなく、音声波形に音響的・韻律的影響を付与する「ゲシュタルト」ラベリングによって適切な音声セグメントを選択する。CHATRは音声コーパスに情報を付与することにより、モデル依存ではなく、自然発話データから直接情報を得る。また、この手法により基本アルゴリズムを変えずに、異なる話者や異なる言語に適用する汎用的な音声合成が実現可能となった。本報告では音声コーパスを7段階の処理(音声収録、ラベリングや分析、圧縮や情報符号化、自動学習、韻律予測、単位選択、波形接続)によって連続発話音声データから合成音声を生成する方式を紹介する。