- 著者
-
鈴木 敏
- 雑誌
- 情報処理学会論文誌 (ISSN:18827764)
- 巻号頁・発行日
- vol.46, no.2, pp.624-630, 2005-02-15
辞書の持つ単語と定義文の関係を利用した,単語のベクトル化のための新しい手法を提案する.提案手法は定義文を再帰展開することにより単語ベクトルを生成する手法である.定義文を単語の集合と見なして再帰展開するときの問題は,この展開が無限に続くため,単語頻度などが計算できなくなることにある.しかし,展開時に一定の重みを仮定することで無限級数の形式に変換でき,計算可能となる.提案手法では,この展開を確率モデルとして扱い,計算の各過程における意味を明確にしている.これにより,応用の見通しが良くなるという長所を得ている.本論文では提案手法の詳細を示すとともに,本手法を単語類似度計算へ適用し,TF-IDFに基づく計算結果と比較・検証を行った.その結果は精度・再現率ともに提案手法が優位であるという明確な有効性を示すものであった.