音声認識アルゴリズムの最前線(オーガナイズドセッション:音声認識及び翻訳アルゴリズム最前線,認識,理解,対話,一般)

2 0 0 0 音声認識アルゴリズムの最前線(オーガナイズドセッション:音声認識及び翻訳アルゴリズム最前線,認識,理解,対話,一般)

著者: 堀貴明
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日: vol.111, no.153, pp.35-40, 2011-07-14

本稿では,音声認識アルゴリズムの最近の進展について概説する.音声認識に関連するアルゴリズムは数多く存在するが,本稿では入力音声に対して最も尤もらし単語列を探索するデコーダ技術に着目する.近年の大語彙連続音声認識のデコーダは時間同期Viterbiビーム探索がベースとなっており,多くの場合,音響モデルには隠れマルコフモデル,言語モデルには単語Nグラムが用いられる.そして,このデコーダを動作させる現在最も有力なアプローチは重み付き有限状態トランスデューサ(Weighted Finite-State Transducer: WFST)による音声認識である.本稿ではWFSTを中心に近年のデコーダ技術を紹介すると共に,コンセンサスデコーディング,並列化,探索最適化,テンプレートベース音声認識といったWFST以外の話題にも触れ,今後のデコーダ技術の展望について述べる.

2017-03-20 10:24:34
2 + 0 Twitter

https://ci.nii.ac.jp/naid/110008800843

言及状況

Twitter (2 users, 2 posts, 0 favorites)

1 1 https://t.co/K0fnDrPReY https://t.co/5pIlTtHXZm

つまり音声認識テンプレート法をやろうとしてるんだな(笑) https://t.co/GgAstSlTZH つまりこれだな(笑) https://t.co/4Pd8bkgJqc

2 0 0 0 音声認識アルゴリズムの最前線(オーガナイズドセッション:音声認識及び翻訳アルゴリズム最前線,認識,理解,対話,一般)

言及状況

Twitter (2 users, 2 posts, 0 favorites)

収集済み URL リスト