著者
白川 真澄 中山 浩太郎 原 隆浩 西尾 章治郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI)
巻号頁・発行日
vol.2008, no.56, pp.89-96, 2008-06-12

分類辞書(タクソノミー)は,文書分類や情報検索などのアプリケーションにおいて幅広くその有用性が実証されてきた.しかし分類辞書の自動構築に関する従来研究では,自然言語処理の技術的限界やノイズデータに起因する精度低下の問題がある.そこで本稿では,大規模Web百科事典の Wikipedia に構築されたカテゴリ構造(ネットワーク)を用いて,概念をベクトル化する手法を提案する.The availability of the taxonomy, which is a kind of category-sorted dictionary, has been demonstrated by various applications such as document classification and information retrieval. However, existing works on automatic taxonomy construction have the problem of decreasing the accuracy due to the technical limitation of statistical NLP (Natural Language Processing) and noise data. In this work, we propose concept vectorization methods using the category network structured in Wikipedia, a large scale Web encyclopedia.

言及状況

Twitter (1 users, 1 posts, 1 favorites)

@y_benjo 多少曖昧ですが確かこんな感じのものだったと思います http://t.co/RMvAhKFA

収集済み URL リスト