著者
佐宗 晃 中村 尚五
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. A, 基礎・境界 (ISSN:09135707)
巻号頁・発行日
vol.80, no.11, pp.1848-1856, 1997-11-25
被引用文献数
8

音声のピッチ抽出が困難であるとされてきた一つの要因に, その変化が非定常で広範囲にわたることが挙げられる. 従来法の多くは固定幅の解析フレーム内で音声が定常的であると仮定しているため, 本質的に抽出誤差を生じてしまう. これを改善するために時間-周波数平面上で解像度を動的に変化できるウェーブレット変換をピッチ抽出に応用する試みがなされている[5], [6]. 本論文では, サブバンドフィルタバンクで効率的に計算できる離散ウェーブレット変換を, 基本波フィルタリングに用いたピッチ抽出の実現法を提案する. サブバンドフィルタバンクは内部でダウンサンプリングを行うので, 基本波フィルタリングの際にエイリアスが間題になる. 提案法では, 入力信号のスケーリングにより, エイリアス問題を回避する. コンピュータシミュレーションでは, 第3高調波まで加え, 時間的変化が高周波になるほど早くなるように, ピッチ周波数を指数的に増加させて合成した試験信号と, 実際の音声に対して行った. 試験信号の場合は, ピッチ周波数によらず誤差率約±2%内で検出できていることが確認できた.

言及状況

はてなブックマーク (1 users, 1 posts)

Twitter (1 users, 1 posts, 0 favorites)

収集済み URL リスト