著者
小野寺 浩 細井 正樹
雑誌
全国大会講演論文集
巻号頁・発行日
vol.45, pp.215-216, 1992-09-28

名称をキーワードとした情報検索では、任意のキーワードに対して、その同意語が複数存在する可能性を考慮しなければならない。これらには、「ホームラン」と「本塁打」などで表される異表記、「スズムシギンコウ」と「スズギン」などの省略語、「シュウマイ」と「シューマイ」のような表記のユレ、「タイヘイ」と「ダイヘイ」のような読みの誤りまで様々なものがある。このうち異表記については類義語辞書に関係を定義しておき、検索時に展開する方法が一般に知られている。しかしながら、上記の全てについて、それぞれ類義語辞書に登録することはメンテナンス上、効率的でないことが予想される。それで我々はこれらの同義語のうち、異表記以外に関して、キーワードと被検索文字との間の類似度を動的に算出し、類似度の高い被検索文字群の中から該当データを特定する方式を提案し、評価することにした。