著者
杉山 雅和 吉村 綾馬 友松 祐太 小町 守
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第35回 (2021)
巻号頁・発行日
pp.2Yin504, 2021 (Released:2021-06-14)

近年、音声認識や音声合成の性能が向上しておりそれらを用いた音声自動応答サービスが広く提供され始めている。音声自動応答サービスでは音声認識の精度がサービスの質に直結する重要な要素であるが、性能が向上しているとはいえ音声認識の精度は完璧ではない。そこで我々は音声認識誤りを含む音声認識結果を、文法誤り訂正と同じように訂正することを考える。文法誤り訂正は、巨大なコーパスで事前学習した言語モデルを用いた深層学習系の手法の台頭により性能が飛躍的に向上しているが、音声認識誤りを含む大規模な日本語コーパスは存在しない。そこで小規模な音声認識コーパスから誤り傾向を分析して誤り付与ルールを策定し、そのルールを巨大な日本語コーパスに適用することで、自動的に擬似音声認識誤りコーパスを作成した。本研究では複数の条件で作成した擬似誤りコーパスを事前学習に用いてTransformerによる誤り訂正の実験を行い、コーパス作成の設定が精度に与える影響の評価を行う。
著者
吉村 綾馬 金子 正弘 梶原 智之 小町 守
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.28, no.2, pp.404-427, 2021 (Released:2021-06-15)
参考文献数
35

信頼できる文法誤り訂正の自動評価手法の構築は,文法誤り訂正の研究および開発の発展に有用である.可能な参照文を網羅することが難しいため,先行研究では参照文を用いない自動評価手法が提案されてきた.そのうちの一つは,文法性・流暢性・意味保存性を評価する 3 つの評価モデルを用いることで,参照文を用いる手法よりも人手評価との高い相関を達成した.しかし,各項目の評価モデルは人手評価には最適化されておらず,改善の余地が残されていた.本研究では,より適切な評価を行える自動評価手法の構築を目的として,各項目の評価モデルを事前学習された文符号化器を用いて人手評価に対して最適化する手法を提案する.また,最適化に理想的である,訂正システムの出力文に対して人手評価が付与されたデータセットの作成を行う.実験の結果,項目ごとの評価モデルおよびそれらを組み合わせた手法の両方で,従来手法と比べて人手評価との相関が向上し,事前学習された文符号化器を用いることおよび訂正文の人手評価に最適化することの両方が貢献していることがわかった.分析の結果,提案手法は従来手法に比べて多くのエラータイプの訂正を正しく評価できていることがわかった.