著者
小黒 玲 近藤 法夫 尾関 和彦
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.96, no.39, pp.61-67, 1996-05-16
被引用文献数
4

最近の音声認識においては、HMMによって得られる尤度に基づいて仮説のスコアを定義することが多い。しかし、連続音声中の単語を検出する場合のように、仮説に対応する音声区間が仮説ごとに異なる場合には、尤度をそのままスコアとすることには問題がある。本研究では、尤度そのものをスコアとするスコア関数と、尤度を何らかの方法で正規化することによって得られるいくつかのスコア関数の特性を比較した。比較は、真の単語/文節終端付近でのスコアの振舞いと、そこでの単語/文節認識率の二つの観点から行なった。その結果、エルゴディックHMMを用いて正規化を行なうスコア関数が、総合的に見て最も好ましい特性を持つことが明らかになった。