著者
川崎 正博 松井 くにお 西野 文人
雑誌
全国大会講演論文集
巻号頁・発行日
vol.41, pp.101-102, 1990-09-04

一般的に,自然言語処理に用いられる単語辞書は十万語にのぼるような大規模なものが多く,一単語が持つ形態素情報,構文情報等のデータも,細かく表現されている反面,複雑化し,扱いにくいものとなっている事が多くみられる。しかし,実際においては,そのような大規模辞書をそのまま利用する事は少なく,システムに必要な情報のみを取り出したシステム用辞書を作り出し,辞書コストの低減を図っている事が多い。本稿では,英語を入力文とし,品詞の推定等を行う形態素解析処理において,そのシステムの特徴を生かし,名詞類を品詞として持つ単語を辞書より削除することによる辞書のコンパクト化の実現方法,および,そのコンパクト辞書を用いて英語形態素解析(Emor)を行った実験結果,今後の課題を述べる。