著者
吉村 貴克 徳田 恵一 益子 貴史 小林 隆夫 北村 正
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.87, no.8, pp.1565-1571, 2004-08-01
被引用文献数
4

本論文は,HMMに基づいた音声合成システムに混合励振源モデルを導入することにより,合成音声の品質向上を図ることを目的とする.我々はこれまでに,メルケプストラム,基本周波数,継続長をHMMの枠組みでモデル化し,HMMからこれらの音声パラメータを出力することによって音声を合成するテキスト音声合成システムを提案した.このシステムでは,合成フィルタ(MLSAフィルタ)を励振する際の励振源モデルとして,有声区間,無声区間でそれぞれパルス列と白色雑音を切り換える単純なモデルを用いている.このような励振源を用いる場合,有声摩擦音のように周期成分と非周期成分をともにもつ音声を合成することができず,合成音声の品質を劣化させる原因となる.そこで本論文では,パルス列と白色雑音を混合する混合励振源モデルを用いることにより高品質な音声を実現している狭帯域音声符号化手法MELPの混合励振源モデルを導入する.この混合励振源モデルは,狭帯域音声符号化だけでなく,広帯域音声符号化へも応用されていることから,音声合成においても有効性が期待される.更に,多くの音声符号化手法で用いられているポストフィルタを導入し,合成音声の品質を向上を図る.また主観評価実験により,本システムにおける混合励振源モデルとポストフィルタの有効性を示す.
著者
徳田 恵一 益子 貴史 小林 隆夫 今井 聖
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.53, no.3, pp.192-200, 1997-03-01
被引用文献数
104

動的特徴 (音声のデルタ及びデルタデルタパラメータを含む混合連続分布HMMから音声パラメータ列を生成するための高速アルゴリズムを提案する。ここでは, 尤度最大の意味で最適な音声パラメータ列を生成することを考え, この問題を現実的な演算量で解くため, 適応フィルタリングにおけるRLSアルゴリズムと類似の手法を用いて高速アルゴリズムを導出した。また, 提案アルゴリズムにより, 静的及び動的特徴の統計情報(平均及び共分散)を反映した音声パラメータ列の生成が可能となることを例によって示すと共に, 提案アルゴリズムの音声の規則合成への応用について考察を加えている。
著者
全 炳河 徳田 恵一 益子 貴史 小林 隆夫 北村 正
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. DSP, ディジタル信号処理 (ISSN:09135685)
巻号頁・発行日
vol.101, no.323, pp.53-58, 2001-09-21
参考文献数
12

多空間上の確率分布に基づくHMM(multi-space probability distribution HMM:MSD-HMM)により, ピッチパターンをモデル化し, 学習したMSD-HMMからピッチパターンを出力する手法を提案し, 音声合成に適応した.しかしこれまでは, 有声/無声境界における動的特徴量を考慮せずにピッチをモデル化していたため, ピッチパターンを生成した際, 無声区間を挟んだ2つの有声区間の間でピッチパターンが不連続に変化する場合があった.本論文では有声/無声境界の動的特徴量を考慮してMSD-HMMによりピッチパターンをモデル化し, より自然性の高いピッチパターンを生成する手法について述べる.
著者
吉村 貴克 徳田 恵一 益子 貴史 小林 隆夫 北村 正
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.11, pp.2099-2107, 2000-11-25
被引用文献数
92

本論文では, HMMに基づく音声合成において, スペクトル, ピッチ, 継続長をHMMの枠組みで統一的にモデル化する手法について述べる.本システムでは, スペクトル・ピッチ継続長モデルとして, それぞれ連続分布HMM, 多空間確率分布HMM(MSD-HMM), 多次元ガウス分布を用い, 音素環境, アクセント, 品調などのコンテクストを考慮したコンテクスト依存モデルを構築する.コンテクスト依存モデルは, 決定木に基づくコンテクストクラスタリング手法によりクラスタリングされる.決定木構築の際, 節分割はMDL基準により行う.このこめ, 新たにMSD-HMMに対するMDL基準によるコンテクストクラスタリング手法を導出している.音声合成実験において, 自然性の高い合成音声が得られること, 更に自動学習によりシステムを構築可能であることを認識した.
著者
益子 貴史 徳田 恵一 小林 隆夫 今井 聖
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.79, no.12, pp.2184-2190, 1996-12-25
被引用文献数
100

隠れマルコフモデル(HMM)からの動的特徴を用いた音声スペクトルパラメータ生成アルゴリズムに基づく規則音声合成システムの新たな枠組みを提案している.本システムで用いるパラメータ生成アルゴリズムでは,HMMで学習した静的,動的特徴の統計情報に従って連続的に遷移するスペクトル系列を生成することができる.規則音声合成にこのアルゴリズムを適用することにより,滑らかで自然性の高い音声を合成できると考えられる.本論文ではこのHMMに基づく規則音声合成システムの枠組みを示し,韻律生成部を除く合成システムを構築した.生成されたスペクトルパラメータを用いて合成した音声の主観評価実験により動的特徴の有効性を示すと共に,合成単位である音素HMMの構成について,音素環境依存性など,いくつかの検討を行っている.
著者
益子 貴史 徳田 恵一 宮崎 昇 小林 隆夫
出版者
Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌. D-2, 情報・システム. 2, パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.J83-D2, no.7, pp.1600-1609, 2000-07-20

隠れマルコフモデル(HMM)に基づいてピッチパターンとスペクトル系列を同時にモデル化及び生成する手法について述べる.ピッチパターンは,連続値をとる有声区間と値をもたない無声区間の時系列として表現されるため,通常のHMMではモデル化することができない.そこで本論文では,多空間上の確率分布に基づくHMM(multi-space probability distribution HMM: MSD-HMM)を適用し,ピッチパラメータとスペクトルパラメータを結合した特徴パラメータを用いてピッチとスペクトルを統一的にモデル化する手法を提案する.また,MSD-HMMにおける決定木に基づくコンテクストクラスタリング手法を導出し,ピッチやスペクトルの変動要因を考慮したモデルの構築手法について述べる.更に,ゆう度最大化基準に基づくパラメータ生成手法を用いることにより,実音声を近似したピッチパターン及びスペクトル系列を生成できることを示す.
著者
全 炳河 大浦圭一郎 能勢 隆 山岸 順一 酒向慎司 戸田 智基 益子 貴史 ブラック アラン 徳田 恵一
雑誌
情報処理学会研究報告音声言語情報処理(SLP)
巻号頁・発行日
vol.2007, no.129(2007-SLP-069), pp.301-306, 2007-12-21

近年,隠れマルコフモデル (HMM) に基づく統計的パラメトリック音声合成方式が注目されている.本方式では,音声スペクトル・励振源・継続長がコンテキスト依存 HMM により同時にモデル化される.音声合成時は,合成したい文章に対応する HMM からの出力確率が最大となるよう,継続長・スペクトル・励振源系列を決定した後,音声合成フィルタを用いて波形が出力される.2002 年より我々は,HMM に基づく音声合成のための研究・開発ツール「HMM 音声合成システム(HTS)」を,オープンソースソフトウェアとして公開してきた.本報告では,その最新の開発状況と今後の予定について述べる.
著者
徳田 恵一 益子 貴史 小林 隆夫 今井 聖
出版者
一般社団法人 日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.53, no.3, pp.192-200, 1997-03-01 (Released:2017-06-02)
被引用文献数
2

動的特徴 (音声のデルタ及びデルタデルタパラメータを含む混合連続分布HMMから音声パラメータ列を生成するための高速アルゴリズムを提案する。ここでは, 尤度最大の意味で最適な音声パラメータ列を生成することを考え, この問題を現実的な演算量で解くため, 適応フィルタリングにおけるRLSアルゴリズムと類似の手法を用いて高速アルゴリズムを導出した。また, 提案アルゴリズムにより, 静的及び動的特徴の統計情報(平均及び共分散)を反映した音声パラメータ列の生成が可能となることを例によって示すと共に, 提案アルゴリズムの音声の規則合成への応用について考察を加えている。
著者
益子 貴史 小林 隆夫 徳田 恵一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.97, no.64, pp.33-38, 1997-05-22
被引用文献数
8 2

隠れマルコフモデル(HMM)に基づいて,任意のテキストからそれに対応する滑らかな唇形状の動きを生成する新たな手法を提案している. 提案手法では,音素や音節等,各音声単位に対応する唇形状の動きをHMMによりモデル化している. 画像生成時には,与えられたテキストに対応する文HMMを音声単位HMMを接続することにより構成し,得られた文HMMから尤度最大化基準により,唇形状の動き表す最適なパラメータ系列を求めている. 本手法の特徴は,既に提案したHMMに基づく音声合成法と同一の枠組で画像の生成が可能な点にあり,音声と画像で同一の音声単位を用いて統一的にモデル化を行なえば,音声・画像の同時生成が容易に実現できる. 本論文では,唇動画像生成システムの構成を示すとともに,実際に小規模な実験的システムを構築し,得られた画像が自然発声に近い滑らかな唇の動きを表現可能なことを示す.
著者
全 炳河 大浦 圭一郎 能勢 隆 山岸 順一 酒向 慎司 戸田 智基 益子 貴史 ブラック アラン 徳田 恵一
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.107, no.405, pp.301-306, 2007-12-13

近年,隠れマルコフモデル(HMM)に基づく統計的パラメトリック音声合成方式が注目されている.本方式では,音声スペクトル・励振源・継続長がコンテキスト依存HMMにより同時にモデル化される.音声合成時は,合成したい文章に対応するHMMからの出力確率が最大となるよう,継続長・スペクトル・励振源系列を決定した後,音声合成フィルタを用いて波形が出力される.2002年より我々は,HMMに基づく音声合成のための研究・開発ツール「HMM音声合成システム(HTS)」を,オープンソースソフトウェアとして公開してきた.本報告では,その最新の開発状況と今後の予定について述べる.
著者
田村 正統 益子 貴史 徳田 恵一 小林 隆夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.85, no.4, pp.545-553, 2002-04-01
被引用文献数
19

本論文では,不特定話者の音声合成単位である"平均声"モデルから,任意話者の特徴をもつ音声を合成する手法を提案する.提案手法は,HMMに基づくテキスト音声合成システムに基づいている.HMMに基づく音声合成システムでは,多空間上の確率分布(MSD)に基づくHMMを用いてスペクトル及びピッチパラメータを同時にモデル化しており,HMMのパラメータを適切に変換することにより合成音声の声質や韻律特徴を変換できる.本論文では,MLLRアルゴリズムをMSD-HMMに拡張し,ピッチ及びスペクトルモデルの話者適応を行うことにより,目標話者の少量の文章を用いて,声質のみでなく韻律情報も適応できることを示す.主観評価試験により,ピッチ及びスペクトルを同時に話者適応することにより,平均声モデルを数文章で適応したモデルから,特定話者モデルからの合成音声に近い音声を合成できることを示した.
著者
徳田 恵一 益子 貴史 宮崎 昇 小林 隆夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.7, pp.1579-1589, 2000-07-25
被引用文献数
65

HMM(hidden Markov model)による時系列の統計的モデル化手法は, 特に音声認識における音声スペクトル列の統計的モデル化手法として広く成功を収めている.HMMは, 離散的なシンボル列を扱う離散分布HMMと、連続値をもったベクトル列を扱う連続分布HMMとに大別されるが, 実際の観測系列には, 離散的なシンボルと連続値が時間的に混在したものがあり, 従来のHMMでこのような観測系列をそのまま取り扱うことはできない.音声のピッチパターンは, このような系列の例である.この問題を解決するため, 本論文では, 可変次元の多空間上における確率分布に基づいたHMMを新たに定義し, 拡張されたHMMのモデルパラメータの再推定アルゴリズムを与えている.拡張されたHMMは, 離散分布HMM, 混合連続分布HMMを特別な場合として含み, 更に離散シンボルと連続値が時間的に混合した観測系列をモデル化することができる.
著者
羽岡 哲郎 益子 貴史 小林 隆夫
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. CS, 通信方式 (ISSN:09135685)
巻号頁・発行日
vol.102, no.517, pp.43-48, 2002-12-10

本稿では,隠れマルコフモデル(HMM)に基づくがラメータ生成アルゴリズムを用いたハンドジェスチャー(手のしぐさ)の3次元コンピュータ・グラフィックス・アニメーション生成について述べる.本研究の目的は,ラベルを用いて記述されたジェスチャーの動作を生成することである.各ラベルは,手の基本的な動作パターンに対応し,各基本動作パターンは,HMMによってモデル化される.HMMによるモデル化の際には,モーションキャプチャによって収録したジェスチャーデータ(手の物理形状モデルのパラメータ列)を学習データとして用いる.そして,与えられたラベル列の順にしたがって,対応するHMMを接続して一つのHMMを構成し,このHMMから尤度最大化基準によりジェスチャーデータを生成し,得られたジェスチャーデータをコンピュータグラフィックス表示することで,アニメーションを生成する.HMMからパラメータを生成する際に,静的・動的特徴の統計量を考慮することによって,滑らかなジェスチャーを生成することが可能となる.実験により,滑らかで自然なハンドジェスチャーのアニメーション生成が可能であることを確認した.