著者
全 炳河 徳田 恵一 益子 貴史 小林 隆夫 北村 正
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DSP, ディジタル信号処理 (ISSN:09135685)
巻号頁・発行日
vol.101, no.323, pp.53-58, 2001-09-21
参考文献数
12

多空間上の確率分布に基づくHMM(multi-space probability distribution HMM:MSD-HMM)により, ピッチパターンをモデル化し, 学習したMSD-HMMからピッチパターンを出力する手法を提案し, 音声合成に適応した.しかしこれまでは, 有声/無声境界における動的特徴量を考慮せずにピッチをモデル化していたため, ピッチパターンを生成した際, 無声区間を挟んだ2つの有声区間の間でピッチパターンが不連続に変化する場合があった.本論文では有声/無声境界の動的特徴量を考慮してMSD-HMMによりピッチパターンをモデル化し, より自然性の高いピッチパターンを生成する手法について述べる.
著者
全 炳河 徳田 恵一 北村 正
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.8, pp.1593-1602, 2004-08-01
被引用文献数
1

近年,連続音声認識システムにおける音響モデルとして,前後の音素環境を考慮した音素コンテクスト依存隠れマルコフモデルが広く利用されている.音素コンテクスト依存隠れマルコフモデルを利用する場合,総モデル数が増加し,システムが非常に多くの自由パラメータを含むことになるため,統計的に信頼できるパラメータを推定することが困難になる.このため,様々なパラメータ共有手法が提案されており,中でも音素決定木に基づく状態共有法は,優れた解決法の一つである.しかし,状態単位の共有構造では特徴ベクトルの全次元に同一の共有構造を構築するため,各特徴量に対し,異なる共有構造を構築できない,適切なパラメータ数を割当てることができない,といった問題点がある.本論文では,記述長最小化基準に基づく次元分割法を導入することにより音素決定木を拡張した,音素・次元決定木を提案する.更に,状態位置に関する分割条件を加え,音素コンテクスト・次元・状態位置を決定木に基づき同時にクラスタリングする手法を提案する.不特定話者連続音声認識実験の結果,提案法は従来の音素決定木に基づく状態共有法と比較して13〜15%誤り率を削減することが示された.
著者
全 炳河 大浦圭一郎 能勢 隆 山岸 順一 酒向慎司 戸田 智基 益子 貴史 ブラック アラン 徳田 恵一
雑誌
情報処理学会研究報告音声言語情報処理(SLP)
巻号頁・発行日
vol.2007, no.129(2007-SLP-069), pp.301-306, 2007-12-21

近年,隠れマルコフモデル (HMM) に基づく統計的パラメトリック音声合成方式が注目されている.本方式では,音声スペクトル・励振源・継続長がコンテキスト依存 HMM により同時にモデル化される.音声合成時は,合成したい文章に対応する HMM からの出力確率が最大となるよう,継続長・スペクトル・励振源系列を決定した後,音声合成フィルタを用いて波形が出力される.2002 年より我々は,HMM に基づく音声合成のための研究・開発ツール「HMM 音声合成システム(HTS)」を,オープンソースソフトウェアとして公開してきた.本報告では,その最新の開発状況と今後の予定について述べる.
著者
全 炳河 大浦 圭一郎 能勢 隆 山岸 順一 酒向 慎司 戸田 智基 益子 貴史 ブラック アラン 徳田 恵一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.107, no.405, pp.301-306, 2007-12-13

近年,隠れマルコフモデル(HMM)に基づく統計的パラメトリック音声合成方式が注目されている.本方式では,音声スペクトル・励振源・継続長がコンテキスト依存HMMにより同時にモデル化される.音声合成時は,合成したい文章に対応するHMMからの出力確率が最大となるよう,継続長・スペクトル・励振源系列を決定した後,音声合成フィルタを用いて波形が出力される.2002年より我々は,HMMに基づく音声合成のための研究・開発ツール「HMM音声合成システム(HTS)」を,オープンソースソフトウェアとして公開してきた.本報告では,その最新の開発状況と今後の予定について述べる.
著者
大浦 圭一郎 全 炳河 南角 吉彦 李 晃伸 徳田 恵一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.108, no.338, pp.215-220, 2008-12-02

本報告では隠れマルコフモデル(Hidden Markov Model; HMM)に基づく音声合成システムにおける共分散パラメータの共有について述べる.近年,音声合成システムへの需要が高まっており,HMMに基づいた音声合成システムでは音声波形の断片をそのまま利用するのではなく,音声波形の特徴をHMMによりモデル化し,HMMのモデルパラメータを合成システムに保持するため,同程度の音質の波形接続法式に比べてフットプリントが小さい利点がある.中でも組み込み向けのシステムには携帯電話,PDA,カーナビ,情報家電,ゲーム機等への用途があるが,必要なCPU,メモリ等が制限されることが多く,更なるフットプリントの縮小が必要である.HMMに基づく音声合成システムにコンテキスト依存モデルを用いることで高精度な音響モデルを構築することができ,決定木に基づくコンテキストクラスタリングを用いて状態共有構造を構築する際に,組み込み用途向けに決定木のサイズを小さくすることも考えられるが,音質が劣化する.本報告では,平均に比べて共分散が音質に与える影響が小さいことに注目し,全てのパラメータの共分散を共有する手法を提案する.このパラメータ共有を仮定した上でのコンテキストクラスタリングを行い,主観評価実験により,パラメータ数を大幅に削減するのみならず,若干の品質改善を達成した.