著者
山本 英子 武田 善行 梅村 恭司 山本 幹雄
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI) (ISSN:09196072)
巻号頁・発行日
vol.2000, no.71, pp.9-15, 2000-07-28
被引用文献数
2

本論文では,情報検索に利用でき、かつ表記の揺れに寛容な類似度を提案する.表記の揺れに対応することができる編集距離という手法があるが,この手法では情報検索精度が弱いことが知られている.そこで,本論文では,情報検索の性能を持ち,かつ表記の揺れにも対応することができるダイナミックプログラミングを用いた類似度の計算法を提案し,その情報検索性能が単語に基づく手法とngramに基づく手法と比較した結果,効果的であり,かつ提案した手法が表記の揺れに寛容であることを報告する.In this paper, we propose a similarity measure suitable for information retrieval and tolerant for morphological variation. Edit distance is well-known similarity measure that can cope with variations. Unfortunately, edit distance is not suitable for information retrieval due to its performance. We have improved The behavior of edit distance by extending its definition. We have compared the proposed similarity measure with the popular similarity measures for information retrieval.

言及状況

はてなブックマーク (1 users, 1 posts)

収集済み URL リスト