- 著者
-
市丸 夏樹
中村 貞吾
宮本 義昭
日高 達
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会研究報告自然言語処理(NL)
- 巻号頁・発行日
- vol.1993, no.79, pp.21-28, 1993-09-16
- 被引用文献数
-
3
シソーラスを意味的な分類として利用し、コーパスから収集した用例と、確率文法を用いて派生語を解析する方法と、大量データに対する仮名漢字変換実験によるその方法の評価について述べる。派生語の語幹名詞と接尾語の連接性を大量の用例データから学習し、学習した用例に含まれていない派生語についても取り扱うことを可能とした。用例そのものを学習に使用した場合には、生成能力が不十分であることが判明したため、用例の語幹をシソーラス上の上位語で置き換えた、一般化サンプルを使用した仮名漢字変換実験を行った。その結果、用例の一般化によって十分な生成能力を得ることができ、正解率を向上させることができることを示した。We are engaged in a research on using a thesaurus to analyze Japanese derivative words, and presented Example-Based Approach with Stochastic Grammar, which gives preference to words of high frequency. Using only raw examples for learning, however, turned out to be failure to produce enough derivative words out of given examples. Our solution to this problem was to use generalized examples for learning; i.e. to propagete the suffixes to synonyms of the body of the examples. In an experiment on kana-kanji convertion, we confirmed that there was a great improvement in number of correct answers.