著者
西 雅大 石田 雅子 田辺 利文 乙武 北斗 吉村 賢治
雑誌
第81回全国大会講演論文集
巻号頁・発行日
vol.2019, no.1, pp.105-106, 2019-02-28

Webカタログの商品説明文では商品名に代表される固有名詞が多く含まれ、一般に利用されている機械学習を用いた機械翻訳では誤った翻訳結果を出力することが多い。商品説明文では類似した言い回しや表現が用いられることが多く、それらを表現パターンとして収集することにより品質の高い翻訳結果を得ることができる。本稿では、未知語の影響を受けやすい形態素解析や構文解析を用いない表現パターンベースの翻訳手法について報告する。本システムでは利用者が逐次的に単語や表現パターンを登録できることを目的に、文脈自由文法の非終端記号に相当する表現パターン上の変数の種類を極力少なくしている。
著者
石田 雅子 西 雅大 田辺 利文 乙武 北斗 吉村 賢治
雑誌
第81回全国大会講演論文集
巻号頁・発行日
vol.2019, no.1, pp.107-108, 2019-02-28

Webカタログの商品説明等を翻訳する場合、商品名など多くの固有名詞が原因で誤った解析が行われ、期待する結果が出力されない場合が多い。本研究では、形態素解析や構文解析を行わない表現パターンベースの翻訳支援システムにおいて、ユーザが逐次的に未知語や新しい表現パターンを追加して翻訳の質を高めることを目的としている。言語学の知識を持たない一般のユーザがこの機能を利用するには、できるだけ正確な未知語情報の検出が必要になる。本稿では、既存の表現パターンを利用した未知語検出の手法について報告する。