著者
田中 英輝 美野 秀弥 越智 慎司 柴田 元也
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2012-NL-209, no.9, pp.1-9, 2012-11-15

著者らは 「やさしい日本語」 でニュース提供するための研究を行っている. 2012 年 4 月より,やさしい日本語のニュースを web で試験的にサービスする公開実験 「NEWS WEB EASY」 のサイトの運用を開始した.本稿ではまず,この公開実験のサイト,および,そこで使っているやさしい日本語の特徴について述べる.次に,提供しているニュースが,外国人 (漢字圏・非漢字圏) と子ども (小学生・中学生) にどのような効果を持つかを確認するために行った実験について報告する.具体的にはやさしい記事と元記事に対する,理解度テストを実施し,その,正解率,あきらめ率,回答時間を測定した.この結果,すべての集団で正解率が向上することがわかり,やさしい記事の基本的な効果を確認した.また,外国人用に作ったやさしい日本語が子どもにも効果的であることが確認できた.さらに詳細な分析を行った結果,漢字圏外国人には実質的に理解度が上昇する効果を,非漢字圏外国人には,記事を最後まで読み通す部分に効果があることを確認した.また,子どもでは,中学生は元記事の理解度がかなり高いことから,小学生に対する実質的な理解度向上の効果が高いことを確認した.
著者
田中 英輝 熊野 正 後藤 功雄 美野 秀弥
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.25, no.1, pp.81-117, 2018-02-15 (Released:2018-05-15)
参考文献数
40
被引用文献数
1

NHK はインターネットサイト NEWS WEB EASY で外国人を対象としたやさしい日本語のニュースを提供している.やさしい日本語のニュースは日本語教師と記者の 2 名が通常のニュースを共同でやさしく書き換えて制作し,本文にはふりがな,難しい語への辞書といった読解補助情報が付与されている.本稿では NEWS WEB EASY のやさしい日本語の書き換え原則,および制作の体制とプロセスの概要と課題を説明した後,課題に対処するために開発した 2 つのエディタを説明する.1 つは書き換えを支援する「書き換えエディタ」である.書き換えエディタは先行のシステムと同様に難しい語を指摘し,書き換え候補を提示する機能を持つが,2 名以上の共同作業を支援する点,難しい語の指摘機能に学習機能を持つ点,また,候補の提示に書き換え事例を蓄積して利用する点に特徴がある.他の 1 つは「読解補助情報エディタ」である.読解補助情報エディタは,ふりがなや辞書情報を自動推定する機能,さらに推定誤りの修正結果を学習する機能を持つ.以上のように 2 つのエディタは,自動学習と用例の利用により,読解補助情報の推定の誤り,やさしい日本語の書き方の方針変更などに日々の運用の中で自律的に対応できるようになっている.本稿では 2 つのエディタの詳細説明の後,日本語教師および記者を対象に実施したアンケート調査,およびログ解析によりエディタの有効性を示す.
著者
美野 秀弥 伊藤 均 後藤 功雄 山田 一郎 徳永 健伸
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.28, no.4, pp.1162-1183, 2021 (Released:2021-12-15)
参考文献数
34

本稿では,文脈を考慮したニューラル機械翻訳の精度向上のため,目的言語側の前文の参照訳と機械翻訳結果の両方を文脈情報として用いる手法を提案する.文脈として,原言語側または目的言語側の周辺の文が利用できるが,目的言語側の周辺の文を用いる手法は翻訳精度が下がることが報告されている.目的言語側の文脈を利用したニューラル機械翻訳では,学習時は参照訳を用い,翻訳時は機械翻訳結果を用いるため,参照訳と機械翻訳結果の特徴の異なり(ギャップ)が原因の 1 つと考えられる.そこで,学習時と翻訳時の目的言語側の文脈情報のギャップを緩和するために,学習時に用いる目的言語側の文脈情報を学習の進行に応じて参照訳から機械翻訳結果へ段階的に切り替えていく手法を提案する.時事通信社のニュースコーパスを用いた英日・日英機械翻訳タスクと,IWSLT2017 の TED トークコーパスを用いた英日・日英,および英独・独英機械翻訳タスクの評価実験により,従来の目的言語側の文脈を利用した機械翻訳モデルと比較して,翻訳精度が向上することを確認した.