著者
中川 祥平 鈴木 基之 松本 和幸 北 研二
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (ISSN:18804535)
巻号頁・発行日
vol.97, no.3, pp.533-539, 2014-03

本論文では,音声からの感情推定において特徴量を正規化して識別を行う方法を提案する.従来感情識別に用いられている平均パワーやピッチといった韻律的特徴量は,感情による変化だけではなく発話内容そのものによって大きく変化する.そのため,たとえ同じ感情で発話されたとしても発話内容が異なれば異なる韻律となり,感情推定の性能低下を招き得る.そこで本論文では,平静の感情で同じ発話内容を発話した音声からも特徴量を抽出し,それとの差分に注目することで感情による特徴量の変化のみを抽出する方法を提案する.使用している5種類の特徴量(平均パワー,ピッチ等)ごとに減算による正規化,除算による正規化,正規化なし,の三つの方法で正規化し,全ての組み合わせの中で最も性能が向上する組み合わせを探索した.その結果,最適な組み合わせによる識別性能は,正規化を行わない従来法と比較して5.98%向上した.正規化法に関する分析を行ったところ,平均パワーは正規化が必要(演算は減算でも除算でも大きな差はない)であり,一方ピッチとMFCCは正規化なし,残りの二つの特徴量についてはどちらでも性能は大きくは変化しないことがわかった.