- 著者
-
金 淵培
江原 暉将
相沢 輝昭
- 雑誌
- 全国大会講演論文集
- 巻号頁・発行日
- vol.44, pp.179-180, 1992-02-24
我々は日本語テレビニュース文を英語に機械翻訳する研究を行っている。日本語ニュース文は約80%が60文字(約30単語)以上で書かれている。このニュース文は、ほとんど引用、並列構造を持っている。このような長文を構文分析する場合、その成功率を高めるには、長文をいくつかの単文に分割することが有効である。人手による分割実験によると分割される前の状態での構文分析の成功率は約60%で、文分割後の構文分析の成功率は82%に増加する。ここでは、形態素解析情報、特に、格助詞「が」、係助詞「は」と用言の活用情報によって接続構造と分割点を把握できることに注目して、適切な分割点の検出と主語の補完を含む分割の生成を行う方法を提案し、その有効性を述べる。