著者
馬 青 吉見 毅彦 渡辺 靖彦
出版者
龍谷大学
雑誌
基盤研究(C)
巻号頁・発行日
2007

英作文において、部分的に適切な英語表現が思い浮かばないとき、本来言い表したい日本語表現(単語またはフレーズ)をそのまま入力するだけで、すなわち、日英混在の入力文から、適切な英語表現を生成してくれる英作文支援システムを開発した。単語レベルでの支援においては最適な文脈による訳語選択手法と大規模で高品質な英語コーパスと超大規模なWebデータの統合利用手法を提案した。フレーズレベルでの支援においては日本語フレーズを構成する各単語の訳語候補の組み合わせによる英語フレーズの生成手法と、大規模で高精度な日英対訳表現抽出手法とそれにより抽出した日英対訳表現を利用した用例ベースに基づく英作文支援手法を開発した。
著者
西村 涼 大田 康人 渡辺 靖彦 村田 真樹 岡田 至弘
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.67, pp.85-90, 2008-07-10
参考文献数
12

メールの文章は他の文書なら改段落しない場合でも、「見やすさ」、「読みやすさ」 を重視して改段落をする場合がある。こうした過剰で不要な段落わけは、メールの機械処理にとって問題である。そこで、メールの文章における段落間の接続の強さを機械学習によって推定する方法を提案し、過剰な段落わけを検出できることを示す。In order to improve the readability, we often segment mail text into smaller paragraphs than necessary. However, this oversegmentation is a problem of e-mail text processing. In this paper, we proposed an estimation method of connectivity between paragraphs in mails using machiene learning technieques, and showed that paragraphs which should be one paragraph can be found by detecting strong connectivity.