- 著者
-
小林 暁雄
増山 繁
関根 聡
- 出版者
- The Institute of Electronics, Information and Communication Engineers
- 雑誌
- 電子情報通信学会論文誌 D (ISSN:18804535)
- 巻号頁・発行日
- vol.J93-D, no.12, pp.2597-2609, 2010-12-01
日本語語彙大系や日本語WordNetといったシソーラスは,自然言語処理の分野における様々な研究に利用可能なように構築されている.これらのシソーラスはその精度を保持するために,人手により,よく吟味されて構築されている.このため,新たな語を追加する際にも,よく検討する必要があり,容易に更新することはできない.一方,Wikipediaはだれでも参加・閲覧できるオンラインの百科事典構築プロジェクトであり,日々更新が行われている.日本語版のWikipediaでは,現在100万本以上の項目が収録されており,非常に大規模な百科事典となっている.このWikipediaのもつ膨大な語彙を,既存のシソーラスの名詞意味体系に分類することができれば,非常に大規模な言語オントロジーを構築することができると期待できる.そこで,本研究では,Wikipediaを構成する構造の一つであるカテゴリーを,Wikipediaの記事の冒頭文を使用し,既存の言語オントロジーの意味クラスの分類階層と連結することで,大規模な言語オントロジーを構築する手法を提案する.