著者
錦戸 信和 党 建武
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. WIT, 福祉情報工学 (ISSN:09135685)
巻号頁・発行日
vol.104, no.389, pp.13-18, 2004-10-22
参考文献数
9

音声から発話状態の逆推定を行う場合、多意性の問題に直面する。3次元の生理学的発話機構モデルを用いる逆推定の手法は、複数の拘束条件が有機的に結合することにより逆推定における多意性を抑えているが、根本的には問題は解決されていない。この多意性に対してわれわれは、複数の発話状態により構成される調音空間内の全域を探索し、推定された発話状態が調音空間内の不安定な領域となることを回避することにより多意性を抑えることが出来ると考える。しかし、調音空間の全探索を行うためには前もって発話状態の分布、及びその発話状態と音声の音響特性との関連を調べる必要があり、その関連を明らかにするために、本稿では発話機構モデルを用いたシミュレーションを行った。その結果、調音空間における調音パラメータの分布について妥当な結果を得たが、F1とF2からなる音響空間においては、一部の母音に対して十分な分布を得る事ができなかった。また、日本語母音/a/の舌の形状の分布と音響パラメータの関係がQuantal theoryを裏付けている事を示した。

言及状況

Twitter (1 users, 1 posts, 0 favorites)

こんな論文どうですか? 生理学的発話機構モデルを用いてQuantal theoryを考慮した音声から発話状態の推定(<特集>福祉と音声処理及び一般)(錦戸 信和ほか),2004 http://id.CiNii.jp/NbijL

収集済み URL リスト