著者
清水 忠昭 木本 雅也 吉村 宏紀 井須 尚紀 菅田 一博
出版者
日本神経回路学会
雑誌
日本神経回路学会誌 (ISSN:1340766X)
巻号頁・発行日
vol.11, no.4, pp.167-175, 2004-12-05 (Released:2011-03-14)
参考文献数
14

We showed a new scheme to characterize speech from LSP parameters by 5 layers sandglass type nonlinear neural network (SNN(NL5)). In order to synthesize speech, we take advantage of useful abilities of SNN(NL5) for compressing and restoring the information. We performed learning experiments on LSP parameters of 5 vowels to investigate the ability of SNN. The followings were verified, 1) the distribution of LSP parameters compressed by SNN(NL5) are similar to the distribution of F1-F2 formants plane. 2) Nonlinear output function of neural elements in second and fourth layers of SNN(NL5) work effectively from view point of separating the distribution of vowels. 3) In order to prevent SNN(NL5) from over learning, there exists the optimum numbers of neural elements in second and fourth layers. For 14 orders of LSP parameters, this number was determined to be 20. 4) There is a preferable property on the plane to separate the vowels distinctively when the restoring error of LSP parameters becomes less. 5) SNN(NL5) can restore the LSP parameters with accuracy enough to synthesize speech from the compressed parameters.
著者
木本 雅也 並木 寿枝 清水 忠昭 井須 尚紀 菅田 一博
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.101, no.270, pp.31-38, 2001-08-23

小規模な応用に向けたVCV規則音声合成方式において, 素片選択の為の2つの基準, i)音韻環境類似度とii)LSP距離による素片の接続歪みについて実験的に検討した.前者を採用した方式は, 後者より各素片に音韻環境情報を余分に付加しておかなければならない.後者を採用した場合, 前者より素片選択処理に時間を要する.VCV音素単位を選択するときに考慮する音韻環境の長さを短く出来れば, 音素片辞書の記憶容量を小さく出来る.筆者らは, 音質を保ちながら音韻環境の長さをどこまで短く出来るかを実験で調べた.実験の結果, 先行2音韻・後続1音韻にまで削減して素片選択しても, 先行5音韻・後続5音韻で素片選択した音声とほぼ同品質の音声を合成出来ることが判った.