著者
堀 貴明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.111, no.153, pp.35-40, 2011-07-14

本稿では,音声認識アルゴリズムの最近の進展について概説する.音声認識に関連するアルゴリズムは数多く存在するが,本稿では入力音声に対して最も尤もらし単語列を探索するデコーダ技術に着目する.近年の大語彙連続音声認識のデコーダは時間同期Viterbiビーム探索がベースとなっており,多くの場合,音響モデルには隠れマルコフモデル,言語モデルには単語Nグラムが用いられる.そして,このデコーダを動作させる現在最も有力なアプローチは重み付き有限状態トランスデューサ(Weighted Finite-State Transducer: WFST)による音声認識である.本稿ではWFSTを中心に近年のデコーダ技術を紹介すると共に,コンセンサスデコーディング,並列化,探索最適化,テンプレートベース音声認識といったWFST以外の話題にも触れ,今後のデコーダ技術の展望について述べる.

言及状況

Twitter (2 users, 2 posts, 0 favorites)

1 1 https://t.co/K0fnDrPReY https://t.co/5pIlTtHXZm
つまり音声認識テンプレート法をやろうとしてるんだな(笑) https://t.co/GgAstSlTZH つまりこれだな(笑) https://t.co/4Pd8bkgJqc

収集済み URL リスト