著者
赤嶺 政巳
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.113, no.366, pp.115-118, 2013-12-12

本稿では、東芝の音声合成技術について、閉ループ学習に基づく音声素片生成から最近の取り組みまでを紹介する。初期の開発では、カーナビなどの情報機器における音声による情報伝達を目的に、高音質、自然性の実現に注力してきた。最近では、インターネット上の音声コンテンツ作成や音声対話インターフェースへの適用に向けて、特定の話者の声や話し方に合成音をカスタマイズする技術、感情的な音声の合成を実現する技術、および応用システムの開発に取り組んでいる。
著者
籠嶋 岳彦 赤嶺 政巳
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.6, pp.1405-1411, 2000-06-25
被引用文献数
18

本論文では, ピッチ周期の変更によるひずみを考慮して, 生成された合成音のひずみが最小になるような音声素片を解析的に生成する方法を提案する.本方式では, 音声素片を用いて合成された音声のひずみを表す評価関数を定義し, この評価関数を最小化するような音声素片を解析的に求めることによって音声素片を生成する.評価関数は, 合成音声と自然音声の波形の2乗誤差によって定義され, 音声データベースより切り出された, 様々な基本周波数の多数の音声セグメントを, 学習のトレーニングベクトルとして用いる.合成器による処理を経て得られる合成音声のひずみを評価し, 音声素片の生成にフィードバックすることから, ここでは本方式を閉ループ学習に基づく解析的生成法と呼ぶ.diphoneを合成単位とする合成器の音声素片を生成する実験を行い, 提案法によって合成音声のひずみが減少し, 合成音声の主観的な品質が向上することを示す.
著者
赤嶺 政巳 籠嶋 岳彦 土谷 勝美
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.1997, no.66, pp.91-96, 1997-07-18
参考文献数
10
被引用文献数
2

従来のLPC合成器は、声道パラメータの操作により声質の変更が比較的容易で合成素片辞書も比較的コンパクトにできるという利点がある反面、音質の点で問題があった。本報告では、自然音声のデータベースから代表素片辞書を自動的に学習することにより明瞭で肉声感豊かな音質を実現する男訣鴇鴎朗初浅器を提案する。Conventional LPC synthesizers have an advantage in flexibility of controlling speech spectrum and in memory size for synthesis units, but do not have a good speech quality. This paper proposes a new residue excited LPC synthesizer with a high speech quality and a new method for automatically generating speech synthesis units. The LPC synthesis filter and its excitation are derived from the synthesis units by LPC analysis.
著者
三関 公生 赤嶺 政巳 押切 正浩
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.93, no.156, pp.1-8, 1993-07-23
被引用文献数
1

本報告は、駆動信号の適応密度パルス列モデルに基づくCELP方式を低レート化に向け改良した3.75kb, SADP-CELP(Adaptive Density Pulse-Code Excited Linear Prediction)音声符号化方式について述べる。方式改良のために、(1)PARCOR-LSP領域でのLPC係数情報のベクトル量子化(2)最適ビット配分に基づくADPパタン決めの(3)整数/非整数の2段階ピッチ周期サーチ(4)ADPの高速直交化サーチ(5)ピッチ情報のサンプル補間を用いたポストフィルタ、を導入した。提案方式は3.75kb/sで6.7kb/sのVSELP方式に近い品質の音声を提供できる。
著者
天田 皇 赤嶺 政巳 三関 公生
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. A, 基礎・境界 (ISSN:09135707)
巻号頁・発行日
vol.79, no.5, pp.1092-1099, 1996-05-25
被引用文献数
1

CELP音声符号化方式の励振符号帳の探索は方式全体の計算量の大半を占め, 音質に与える影響も大きいため, 少ない計算量で精度良く探索を行う必要がある. 直交化探索法は励振符号帳の探索方法として現在広く用いられている方法であり, 多段符号帳を逐次探索する場合, 目標ベクトルとのひずみを最小にする符号ベクトルを探索することができる. しかし, 探索ループ内で符号ベクトルを直交化する必要があり計算量が増加する問題がある. 本論文では符号帳探索を幾何学的に考察し, 従来の直交化探索法と異なる視点から多段符号帳における目標ベクトルとの誤差最小化の問題を定式化する. 提案法は直文化探索法と同じ探索結果を与えることを示す. また, 提案法は探索ループ内で符号ベクトルの直交化が不要なため評価式の分子で予備選択を行う場合は直交化探索法に比べ計算量を削減できることを示す. 符号帳探索の計算量を予備選択を行う条件の下で比較し, 提案法は直文化探索法に比べ符号帳の段数が増加するほど計算量削減の効果が大きくなることを示す. 最後に, 計算機シミュレーションによって予備選択が音質に与える影響を調べた結果を示す. 実験に用いたCELP方式では予備選択候補数4〜8でSNRsegの劣化は0.ldB以下であり, このとき, 計算量は直交化探索法に比べ約2MOPS削減できることが確認された.