著者
森永 凌汰 玉城 大生 小野 智司
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第36回 (2022) (ISSN:27587347)
巻号頁・発行日
pp.2B5GS602, 2022 (Released:2022-07-11)

近年の深層ニューラルネットワーク(DNN)の急速な発展は,自然言語処理(NLP)分野においても様々な技術革新を起こしている.しかし,DNNがその性能を発揮するためには大量の学習データが必要であり,特に教師信号のラベル付けがボトルネックとなっている.このため,教師なし学習データから教師あり学習データを生成する自己教師あり学習が注目を集めている.一方で,日本語を対象とした文章校正支援の研究が広く行われており,表記ミスや同音異義語誤りなどの表層的な誤りの検出が可能となっている.本研究では,文法的あるいは意味的な整合性に基づいて,文の接続関係の妥当性を判定する自己教師あり学習方式を提案する.提案手法は,ランダムに選択された2つの文を切断し,結合することで文を合成し,結合箇所へのラベル付けにより,教師なし学習データから教師あり学習データを合成する.実験により,NLPタスクにおける提案手法の有効性を確認した.