著者
徳永 健伸 岩山 真
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL)
巻号頁・発行日
vol.1994, no.28, pp.33-40, 1994-03-17
被引用文献数
18

本論文では,新しい文書のインデックスの重み付け手法を提案し,これを文書の自動分類に応用した実験結果について報告する.本論文で提案する手法は情報検索の分野で一般的に使われている重み付け手法IDFを改良したもので,これをWIDFと呼ぶ.200から6000程度の文書の自動分類実験の結果,WIDFを使うことによってIDFに比べ最大で7.4%精度を改善することができた.This paper proposes a new term weighting method called weighted inverse document frequency (WIDF). As its name indicates, WIDF is an extension of IDF(inverse document frequency) to incorporate the term frequency over the collection of texts. WIDF of a term in a text is given by dividing the frequency of the term in the text by the sum of the frequency of the term over the collection of texts. WIDF is applied to the text categorization task and proved to be superior to the other methods. The improvement of accuracy on IDF is 7.4% at the maximum.

言及状況

Twitter (2 users, 2 posts, 0 favorites)

収集済み URL リスト