音声認識のための確率文脈自由文法に基づく言語モデルの構築と評価

1 0 0 0 音声認識のための確率文脈自由文法に基づく言語モデルの構築と評価

著者: 堀智織加藤正治伊藤彰則好田正紀
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会論文誌. D-2, 情報・システム 2-パターン処理 (ISSN:09151923)
巻号頁・発行日: vol.83, no.11, pp.2407-2417, 2000-11-25
参考文献数: 9
被引用文献数: 9

本論文では, 確率文脈自由文法(Stochastic Context Free Grammar:SCFG)を大語彙連続音声認識に適用する手法として, 文節単位の係り受け制約をもつSCFGを提供する.SCFGは, N-gramのような局所的な制約だけでなく, 文全体にわたる大局的な制約をも記述できることから, 非常に表現力の高い言語モデルとして知られている.しかし, SCFGのパラメータ推定にはInside-Outsideアルゴリズムを用いる必要があり, 非終端記号数の3乗, かつ入力系列長の3乗に比例する莫大な計算量を要する.そのため, SCFGは大量のテキストコーパスから推定することが難しく, これまで大語彙連続音声認識用の言語モデルとして利用されることはほとんどなかった.提案する文節単位の係り受けSCFGは, Inside-Outsideアルゴリズムの計算量を係り受けの制約により非終端記号数の2乗に, 文節単位の導入により更にその約1/8に削減できる有効なモデルである.EDRコーパスを用いた実験では, 提案法を含む各種SCFGの性能とパラメータ推定に要する処理量を比較し, 提案法が計算量を大幅に削減しつつ, パープレキシティがほとんど増加しいことを示す.毎日新聞コーパスを用いた実験では, 大規模な文節単位の係り受けSCFGを構築し, 大語彙連続音声認識システムに実装する.そして, 語彙サイズ5000の音声認識実験を行い, SCFGによる認識性能はTrigramには及ばないものの, Trigramと併用した場合にはTrigram単独の場合に比べて約14%の単語誤りを削減できることを示す.

2020-07-18 21:31:38
1 + 0 Twitter

https://ci.nii.ac.jp/naid/110003183852

言及状況

Twitter (1 users, 1 posts, 0 favorites)

昔考えた inside-outside と forward-backward が全部入りのやつ https://t.co/Fw9Pb3XykZ

収集済み URL リスト

https://ci.nii.ac.jp/naid/110003183852 (1)