著者
内山 香 山下 亮 鈴木 海渡 田上 翼 塙 一晃 乾 健太郎 小宮 篤史 藤村 厚夫 町野 明徳 楊井 人文
出版者
一般社団法人 人工知能学会
雑誌
JSAI大会論文集
巻号頁・発行日
vol.2018, pp.4Pin126, 2018-07-30

<p>国内外を問わず誤情報の拡散が社会的な問題となっており,情報の真偽検証の必要性が急増している. そこで本研究では情報の真偽検証を効率的に行うための支援システムの構築を行った. 本システムではニュース記事に対して言及しているSNS上の投稿をもとに人手の検証を必要とするニュース記事を推定する. 作成したシステムを用いることで検証を必要とする記事の探索作業の効率化を期待できることが確かめられた.</p>
著者
藤井 諒 三田 雅人 阿部 香央莉 塙 一晃 森下 睦 鈴木 潤 乾 健太郎
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.28, no.2, pp.450-478, 2021 (Released:2021-06-15)
参考文献数
45
被引用文献数
1

ニューラル機械翻訳 (NMT) の登場により,ニュース記事など文体の整った入力に対する翻訳の品質は著しく向上してきた.しかし,ソーシャル・ネットワーキング・サービス (SNS) に代表されるユーザ生成コンテンツ (UGC) を対象とした NMT の翻訳には依然として多くの課題が残されている.異文化・多言語交流の促進に向けた機械翻訳システムの活用には,そうした特異な入力を正確に扱うことのできる翻訳モデルの構築が不可欠である.近年では,UGC における翻訳品質の向上に向けたコンペティションが開催されるなどその重要性は広く認知されている.一方で,UGC に起因するどのような要因が機械翻訳システムの出力に悪影響を及ぼすのかは明らかでなく,偏在するユーザコンテンツの翻訳に向けた確かな方向性は依然として定まっていない.そこで本研究では,言語現象に着目した日英機械翻訳システムの頑健性測定データセット PheMT を提案する.特定の言語現象を含む文に特化したデータセットにより,当該表現の翻訳正解率,および正規化に基づく翻訳品質の差分を用いた精緻なエラー分析を可能にする.構築したデータセットを用いた評価により,広く商用に利用される機械翻訳システムを含む,最先端の NMT モデルにおいても十分に扱えない,対処すべき言語現象の存在を明らかにする.