著者
馬 青 吉見 毅彦 渡辺 靖彦
出版者
龍谷大学
雑誌
基盤研究(C)
巻号頁・発行日
2007

英作文において、部分的に適切な英語表現が思い浮かばないとき、本来言い表したい日本語表現(単語またはフレーズ)をそのまま入力するだけで、すなわち、日英混在の入力文から、適切な英語表現を生成してくれる英作文支援システムを開発した。単語レベルでの支援においては最適な文脈による訳語選択手法と大規模で高品質な英語コーパスと超大規模なWebデータの統合利用手法を提案した。フレーズレベルでの支援においては日本語フレーズを構成する各単語の訳語候補の組み合わせによる英語フレーズの生成手法と、大規模で高精度な日英対訳表現抽出手法とそれにより抽出した日英対訳表現を利用した用例ベースに基づく英作文支援手法を開発した。
著者
南條浩輝 山本 祐司 吉見 毅彦
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.53, no.6, pp.1644-1653, 2012-06-15

機械翻訳(MT)の品質向上のための翻訳前の書き換え(前編集)について述べる.これまでの前編集は主にルールに基づくものであるため,MTシステムに依存し,かつシステム構築に労力を要した.これに対し,本論文では,MTシステムに依存しない統計的前編集システムの自動構築手法を提案する.具体的には,対象とするMTシステムに適した前編集システムを,当該MTシステムを含む複数のMTシステムおよび対訳コーパスから自動構築する手法を提案する.本手法の最も重要な特徴は,前編集によって翻訳品質の向上が得られる学習データを自動生成できる点にある.ロイター日英記事の対応付けデータを用いて4種類の日英MTシステム用前編集システムを構築したところ,3種類のMTシステムについて,多くの文に対して翻訳品質を向上させる前編集システムが構築できた.提案手法である前編集システムの学習データの自動生成は,3種類のMTシステムの前編集システム構築に効果的であったこと,および他の1種類のMTシステムの前編集システム構築に悪影響がなかったことを示し,提案手法の有効性を示した.