著者
伊藤 太介 武田 一哉 板倉 文忠
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.101, no.325, pp.59-64, 2001-09-21
参考文献数
10
被引用文献数
1

本報告では, ささやき声の音響特性と音声認識手法について述べる.データベースとして100名以上の話者が発生した6, 000文以上のささやき声, 通常発生, 顔画像を収録した.ささやき声と通常発声の比較では, 1)ケプストラム距離が有声音で4dB, 無声音で2dBであること, 2)ささやき声のスペクトルの傾きが通常発生に比べ緩やかであること, 3)1.5kHz以下のフォルマント周波数が通常発声に比べ高くなっていることが得られた.収録したささやき声から音響モデル(HMM)を学習し認識を行ったところ, 64%の単語正解精度が得られ, MLLRによる話者適応を用いた認識では, 単語正解精度が76%まで改善された.