著者
谷中 瞳 峯島 宏次 Pascual Martínez-Gómez 戸次 大介
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.25, no.3, pp.295-324, 2018-06-15 (Released:2018-09-15)
参考文献数
45

文と文がどのような意味的関係にあるかという文間の関連性の計算は,情報検索や文書分類,質問応答などの自然言語処理の基盤を築く重要な技術である.文の意味をベクトルや数値で表現する手法は未だ発展途上であり,自然言語処理分野においては,様々な機械学習による手法が活発に研究されている.これらの手法では,文字や単語を単位としたベクトルを入力として,それらの表層的な出現パターンとその振る舞いを学習することで,文ベクトルを獲得している.しかし,否定表現を含む文など,文の構造的意味を正確に表現できるかは自明ではない.一方で,形式意味論においては,表現力の高い高階論理に基づいて意味の分析を行う研究が発展しているが,文間の関連性のような,連続的な意味的関係を表現することが困難である.そこで本研究では,機械学習と論理推論という二つの手法を組み合わせて文間の関連性を計算する手法を提案する.具体的には,文間の含意関係を高階論理の推論によって判定するシステムの実行過程から,文間の関連性に寄与する特徴を抽出し,文間の関連性を学習する.文間類似度学習と含意関係認識という2つの自然言語処理タスクに関して提案手法の評価を行った結果,推論の過程に関する情報を特徴量に用いることによって,いずれのタスクにおいても精度が向上した.また,含意関係認識用データセットの一つであるSICKデータセットの評価では,最高精度を達成した.
著者
Dan Han Pascual Martínez-Gómez Yusuke Miyao Katsuhito Sudoh Masaaki Nagata
出版者
Information and Media Technologies Editorial Board
雑誌
Information and Media Technologies (ISSN:18810896)
巻号頁・発行日
vol.9, no.3, pp.272-301, 2014 (Released:2014-09-15)
参考文献数
44

In statistical machine translation, Chinese and Japanese is a well-known long-distance language pair that causes difficulties to word alignment techniques. Pre-reordering methods have been proven efficient and effective; however, they need reliable parsers to extract the syntactic structure of the source sentences. On one hand, we propose a framework in which only part-of-speech (POS) tags and unlabeled dependency parse trees are used to minimize the influence of parse errors, and linguistic knowledge on structural difference is encoded in the form of reordering rules. We show significant improvements in translation quality of sentences in the news domain over state-of-the-art reordering methods. On the other hand, we explore the relationship between dependency parsing and our pre-reordering method from two aspects: POS tags and dependencies. We observe the effects of different parse errors on reordering performance by combining empirical and descriptive approaches. In the empirical approach, we quantify the distribution of general parse errors along with reordering quality. In the descriptive approach, we extract seven influential error patterns and examine their correlations with reordering errors.