著者
吉原 亨 蔦木圭悟 高橋 弘太
雑誌
情報処理学会研究報告音声言語情報処理(SLP)
巻号頁・発行日
vol.2008, no.123(2008-SLP-074), pp.233-238, 2008-12-02

できるだけ聞き落としを生じることなく,時間的な効率を上げて音声再生を行うためには,個々の音声に対して最適な再生速度を決定するための指標が必要となる.本稿では,この問題に関して得られた 2 つの成果について発表する.第一の成果は, 2 つの異なる狭帯域エネルギの時間変化に着目した話速推定法を提案し,正規化した誤差で 16% の推定精度で話速推定が行えることを示したことである.第二の成果は,通常発話の音声と高速発話の音声を,それぞれ極めて速い話速に話速変換した結果を観察し,高速発話を話速変換した音声が,より調波構造の乱れが少ないことを示したことである.本稿は,我々で製作している話速バリエーション型音声データベース (SRM-DB) を用いて行った.我々は本研究を SRV-DB の有効な利用法の一例として発表する.

言及状況

Twitter (1 users, 1 posts, 0 favorites)

こっちは挟帯域エネルギーとの相関で推定するのか。こっちの方がシンプルかな 話速推定 https://t.co/spKSZxmGMn

収集済み URL リスト