- 著者
-
南條浩輝
山本 祐司
吉見 毅彦
- 雑誌
- 情報処理学会論文誌 (ISSN:18827764)
- 巻号頁・発行日
- vol.53, no.6, pp.1644-1653, 2012-06-15
機械翻訳(MT)の品質向上のための翻訳前の書き換え(前編集)について述べる.これまでの前編集は主にルールに基づくものであるため,MTシステムに依存し,かつシステム構築に労力を要した.これに対し,本論文では,MTシステムに依存しない統計的前編集システムの自動構築手法を提案する.具体的には,対象とするMTシステムに適した前編集システムを,当該MTシステムを含む複数のMTシステムおよび対訳コーパスから自動構築する手法を提案する.本手法の最も重要な特徴は,前編集によって翻訳品質の向上が得られる学習データを自動生成できる点にある.ロイター日英記事の対応付けデータを用いて4種類の日英MTシステム用前編集システムを構築したところ,3種類のMTシステムについて,多くの文に対して翻訳品質を向上させる前編集システムが構築できた.提案手法である前編集システムの学習データの自動生成は,3種類のMTシステムの前編集システム構築に効果的であったこと,および他の1種類のMTシステムの前編集システム構築に悪影響がなかったことを示し,提案手法の有効性を示した.