情報量基準で語彙分割したPLSA言語モデルによる話題・文型適応(Session-6 音声認識,第8回音声言語シンポジウム)

1 0 0 0 情報量基準で語彙分割したPLSA言語モデルによる話題・文型適応(Session-6 音声認識,第8回音声言語シンポジウム)

著者: 栗山直人鈴木基之伊藤彰則牧野正三
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日: vol.106, no.442, pp.55-60, 2006-12-15

PLSAは言語モデルの文脈適応に一般的に用いられる手法である.このPLSAの新しい利用方法を提案する.PLSA言語モデルの語彙を「話題語」「文型語」「汎用語」の3クラスに分割し,話題語PLSAモデルと文型語PLSAモデルを別々に学習・適応した後に3つのモデルを統合する.また新聞記事とCSJ間での品詞分類の出現パターン変化に基づいた,語彙分割基準の自動生成を提案する.評価実験では話題と文型の特徴が学習データで共起していないテキストについて,従来のPLSA言語モデルと比べ15.48%のperplexity削減が得られた.

2010-09-05 22:31:20
1 はてなブックマーク

https://ci.nii.ac.jp/naid/110006164227

言及状況

はてなブックマーク (1 users, 1 posts)

[paper][research]

収集済み URL リスト

https://ci.nii.ac.jp/naid/110006164227 (1)