- 著者
-
松井 くにお
難波 功
井形 伸之
- 出版者
- 一般社団法人 情報科学技術協会
- 雑誌
- 情報の科学と技術 (ISSN:09133801)
- 巻号頁・発行日
- vol.50, no.1, pp.9-13, 2000
- 参考文献数
- 13
- 被引用文献数
-
1
全文検索技術は,統制語によるキーワード付けを行う方式と比較して,全処理を自動化できることによる低コスト性,検索量の増加による再現率の向上,という特徴を持つ。全文検索を実現するアルゴリズムには,文字列検索,シグネチャファイル,転置ファイルなどがある。日本語の全文検索システムでは特徴素の取り方として,形態素解析(単語)とN-gram(文字)があり,それぞれ得失がある。転置ファイルを用いた全文検索技術では,ランキング検索が用いられることが多いが,これには通常tf-idf法(文書中の単語頻度×文書DB中での単語の重要度)により関連度が計算される。