著者
谷垣 宏一 徳本 修一 撫中 達司 匂坂 芳典
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. 自然言語処理研究会報告
巻号頁・発行日
vol.2015, no.5, pp.1-8, 2015-01-12

語彙を限定しない語義曖昧性解消 (all-words WSD) のための新しい教師なし学習モデルを提案する.all-words WSD は,辞書知識を言語処理に活用する基礎技術として実用化が期待されるが,識別対象である語義は種類が膨大でかつ分布がドメインに強く依存する性質があり,ラベル付きコーパスの構築を前提とする教師あり学習では実用化を見込むことが難しい.提案法は,ラベルなしコーパスの語と膨大な語義の間に自然な対応を推定するため,2 つの制約をモデル化する: 1) 類似した文脈に出現する語群の語義は,互いの語義からの外挿に従う.2) 同じ語の各出現における語義は,単語タイプ毎の事前分布に従う.これらの相補的制約を単一の階層ベイズモデルに統合し,教師なし all-words WSD を実現する.SemEval データセットを用いた実験結果より提案法の有効性を示す.