著者
松川 智義 中村 順一 長尾 真
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.1989, no.40(1989-NL-072), pp.1-8, 1989-05-19

自然言語処理のシステムを構築する際に用いられる単語の分類を客観的なデータ解析から得る方法がいろいろと提案されている.その中には,単語の共起に関する実例データ(共起データ)を用いて単語を分類するというアプローチがある.ところが,それらの多くが前提としている単語間の「距離」(意味的な遠さ)だけで,多様な単語の意味を表現することには限界がある.また,実際の共起データには様々な「雑音」が混ざっている.本研究では,共起データに基づいた,「距離」という考え方を用いない,「雑音」に強い,単語のクラスタリング・アルゴリズムを作成した.