- 著者
-
笠原 要
松澤 和光
石川 勉
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会論文誌 (ISSN:18827764)
- 巻号頁・発行日
- vol.38, no.7, pp.1272-1283, 1997-07-15
- 参考文献数
- 26
- 被引用文献数
-
99
人間は,単語の意味を表す「概念」間の類似性を,その単語が扱われる文脈や状況の変化に応じて柔軟に判別する.本論文では,属性とその重みより構成した概念の知識ベース(「概念ベース」)を用い,文脈や状況等を表現する単語(「観点」)を指定したときに,観点に応じて概念間の類似性を判別する方法を提案する.この方式は,概念どうしの類似性判別を行う前に,概念中の属性の重みを観点に基づいて強調することを特徴とする.概念ベースは,まず国語辞書等の語義文から自立語の出現頻度に基づいて属性とその重みを獲得し,次いで得られた概念ベースの自己参照による新たな属性の追加,および不要な属性の統計的な除去からなる精錬を行うことによって,完全に機械的に構築した.実際に作成した約4万の日常語に関する概念ベースで方式評価を行った.この結果,提案の類似性判別方式がシソーラスを用いる従来の方式に比べて有効であり,また,この判別において観点が効果的であることを明らかにした.We propose a method for measuring the semantic similarity berween words using a largescale knowledge base that is automatically constructed from machine-readable dictionaries and is self-refined.This method of measuring similarity takes into consideration the fact that similarity changes depend on situation or context,this is what we call a 'viewpoint.'A feature of this method is that certain parts of the overall concept of measured words,compared with each other,are emphasized by using the viewpoint when calculating the degree of similarity.An experimental knowledge base,which contains knowledge of 40,000 Japanese daily-used words,was employed in order to evaluate the proposed method of measurement.The similarity measurements with the proposed method were closer to those decided by human judges than were similarity measurements made using the conventional way of using a thesaurus.Moreover,it was found that consideration of the viewpoint was effective when measuring the semantic similarity.