著者
佐宗 晃 中村 尚五
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. A, 基礎・境界 (ISSN:09135707)
巻号頁・発行日
vol.80, no.11, pp.1848-1856, 1997-11-25
被引用文献数
8

音声のピッチ抽出が困難であるとされてきた一つの要因に, その変化が非定常で広範囲にわたることが挙げられる. 従来法の多くは固定幅の解析フレーム内で音声が定常的であると仮定しているため, 本質的に抽出誤差を生じてしまう. これを改善するために時間-周波数平面上で解像度を動的に変化できるウェーブレット変換をピッチ抽出に応用する試みがなされている[5], [6]. 本論文では, サブバンドフィルタバンクで効率的に計算できる離散ウェーブレット変換を, 基本波フィルタリングに用いたピッチ抽出の実現法を提案する. サブバンドフィルタバンクは内部でダウンサンプリングを行うので, 基本波フィルタリングの際にエイリアスが間題になる. 提案法では, 入力信号のスケーリングにより, エイリアス問題を回避する. コンピュータシミュレーションでは, 第3高調波まで加え, 時間的変化が高周波になるほど早くなるように, ピッチ周波数を指数的に増加させて合成した試験信号と, 実際の音声に対して行った. 試験信号の場合は, ピッチ周波数によらず誤差率約±2%内で検出できていることが確認できた.
著者
佐宗 晃 中村 尚五
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会ソサイエティ大会講演論文集
巻号頁・発行日
vol.1996, 1996-09-18

喉頭癌などのために喉頭全摘出を行い声帯を失ってしまった人が音声を取り戻す方法の一つに、食道に空気を貯蔵し食道入口を代用声帯として発声する食道法がある。その音質は(1)気管孔などから発生する雑音を含み、(2)発声が長く続かず途切れ、(3)ピッチ周期が不規則に変化し、(4)男女を問わず平均的なピッチ周波数が低いなどの特徴を持ち明瞭度が著しく悪い。ある程度訓練により音質を改善する事ができるが、食道者が不自由なくコミュニケーションをとれるようになるにはかなりの時間を要する。このような食道者の負担を軽減すべく、音質改善装置の研究が進められている。現在行なわれている音質改善法の一つに、腺形予測法を用いて食道音声から声道バラメータを抽出し、それをもとに人工的に生成した音源信号から音声を再合成する方法が文献などで述べられている。しかし、この方法では話者によって合成音声の音質がオリジナル音声よりも劣化すると報告されている。ここでは、食道音声から線形予測法による声道パラメータ抽出の問題点を考察する。