文法誤り訂正モデルの横断評価

doi:10.5715/jnlp.28.160

1 0 0 0 OA 文法誤り訂正モデルの横断評価

著者: 三田雅人水本智也金子正弘永田亮乾健太郎
出版者: 一般社団法人言語処理学会
雑誌: 自然言語処理 (ISSN:13407619)
巻号頁・発行日: vol.28, no.1, pp.160-182, 2021 (Released:2021-03-15)
参考文献数: 42
被引用文献数: 1

文法誤り訂正の既存研究の多くはこれまで主に CoNLL-2014 評価データセットを用いた単一コーパス上で文法誤り訂正モデルを評価してきた.しかし,書き手の習熟度やエッセイのトピックなど様々なバリエーションのある入力文が想定される文法誤り訂正タスクにおいて,タスクの難易度は各条件下によって異なるため,単一コーパスによる評価では不十分であると考えられる.そこで本研究では,文法誤り訂正の評価の方法論として,単一コーパス評価は不十分であるという仮説に基づきコーパス横断評価の必要性について調査を行う.具体的には,4 種類の手法 (LSTM, CNN, Transformer, SMT) を 6 種類のコーパス (CoNLL-2014, CoNLL-2013, FCE, JFLEG, KJ, BEA-2019) で評価し,各コーパス間でモデル順位にばらつきが生じるかについて検証を行った.評価実験の結果,モデル順位は各コーパスによって大きく変動したため,既存の単一コーパス評価では不十分であることがわかった.また,横断評価はメタ評価方法としてだけではなく,実応用を見据えた場合においても有用であると考えられる.そこで,横断評価の有用性のケーススタディとして,文法誤り訂正の入力に想定される代表的な条件の一つである,書き手の習熟度を評価セグメントとした場合の横断評価について調査を行った.その結果,書き手の習熟度が初中級レベルと上級レベル間ではモデルの性能評価に関して大きな乖離があることがわかった.

2021-09-27 14:21:12
1 + 0 Twitter

言及状況

外部データベース (DOI)

Twitter (1 users, 1 posts, 0 favorites)

@katsuhitosudoh SMT時代を取り戻しましょう！（違）ちなみにGECだと、例えば習熟度の高い学習者が書いたテキストにおいてはSMTの方がNMTよりも性能が高いという結果も観測されてるので使いどころによっては...という感じがしてます。https://t.co/LfvEofQjIk

収集済み URL リスト

https://www.jstage.jst.go.jp/article/jnlp/28/1/28_160/_pdf/-char/ja (1)