著者
須藤 真理 横尾 英俊
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報学基礎(FI)
巻号頁・発行日
vol.1995, no.106, pp.33-40, 1995-11-09
被引用文献数
10

Mgシステムは,英文を対象とする全文検索システムである.ファイルの効率的な管理のために,データ圧縮技術を最大限に利用している点に特徴がある.本論文では,このシステムを日本語対応に拡張する.拡張したシステムでは,日本語文書に対する字面処理によって転置ファイルを自動生成し,これを利用したブール検索や重み付き検索を可能にしている.このシステムによって,特に,日本語文書と重み付き検索との相性のよさが明確になる.The mg system is a full-text retrieval system for English documents, in which data compression techniques are fully utilized in order to realize maximal storage efficiency. This paper extends the system so that it can deal with Japanese texts. The extended system generates an inverted file from a set of documents by automatic extraction of terms with no use of dictionary or grammatical knowledge of the Japanese language. The system can accept several types of queries including Boolean and ranked ones. This paper shows that the retrieval by ranked queries and the Japanese language match well with each other.