著者
塚越 駿 笹野 遼平 武田 浩一
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.30, no.1, pp.125-155, 2023 (Released:2023-03-15)
参考文献数
39

自然言語文をベクトルとして表現する文埋め込みは,深層学習を用いた自然言語処理の基礎技術として盛んに研究されており,特に自然言語推論 (Natural Language Inference; NLI) タスクに基づく文埋め込み手法が成功を収めている.しかし,これらの手法は大規模な NLI データセットを必要とすることから,そのような NLI データが整備された言語以外については高品質な文埋め込みの構築が期待できないという問題がある.本研究ではこの問題を解決するため,NLI データと比べて多くの言語において整備が行われている言語資源である辞書に着目し,辞書の定義文を用いた文埋め込み手法を提案する.また,標準的なベンチマークを用いた評価実験を通し,提案手法は既存の NLI タスクに基づく文埋め込み手法と同等の性能を実現すること,評価タスクの性質や評価データの抽出方法により性能に差異が見られること,これら2手法を統合することでより高い性能を実現できることを示す.