- 著者
-
柴木 優美
永田 昌明
山本 和英
- 雑誌
- 研究報告自然言語処理(NL)
- 巻号頁・発行日
- vol.2010-NL-198, no.3, pp.1-8, 2010-09-09
Wikipedia を利用し,人に関する大規模な is-a 関係のオントロジーを構築する手法を提案する.本手法では初めに,人を表すカテゴリを機械学習による分類器で判定し,Wikipedia の階層構造をそのまま利用して is-a 関係だけから構成される人のカテゴリ階層を構築する.その後,人を表すカテゴリが付与されている記事から,人を表す記事をインスタンスとして抽出する.機械学習では,カテゴリ名及びカテゴリの周辺の単語が,日本語語彙大系のインスタンスとどのようにマッチするかを素性にした.その結果,人を表すカテゴリを適合率 99.3%,再現率 98.4%,人を表すインスタンスを適合率 98.2%,再現率 98.6% で抽出することができた.