- 著者
-
中川 聖一
大谷耕嗣
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
- 巻号頁・発行日
- vol.1997, no.52, pp.13-18, 1997-05-26
- 被引用文献数
-
1
一般に話し言葉の文法の構築は難しい。大量のテキスト文集合がある場合には、n?gramが適切である。しかし、比較的小規模なタスクやユーザが容易に設計したいタスクでは文脈自由文法 (F) が適切である。本稿では文のカバー率を改善するために、n?gramとCFGの利点を取り入れた文法規則の自動学習法について述る。学習方法は、システムに入力された文が文法規則が不備なために受理できない時、システムがこの入力文を使って単語クラスペアやバイグラムの学習することによって実行する。この単語クラスペアやバイグラムの適用方法を変えたいくつかの実験をテキストと音声認識で行ない、文法学習による解析 (認識) 文数の向上及びパープレキシティの変化について調べた。In this paper, we describe an automatic learning method of the grammar rules for improving coverage of acceptable sentences. The learning method is carried out by a sentence which is not accepted by production rules. The system learns wordclass pairs or bigram using this input sentence. We experimented on some strategies of applying wordclass pairs on text parsing and speech recogniton level, and evaluated the coverage of acceptable sentences (or speech recognition rate) and perplexity using above methods.