著者
銭本 友樹 古俣 槙山 宇津呂 武仁
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第37回 (2023) (ISSN:27587347)
巻号頁・発行日
pp.4A2GS605, 2023 (Released:2023-07-10)

対話システムは常に一貫した口調を保つことが望まれるため,文全体の口調の類似性評価は重要なタスクである.しかしながら日本語には多様な口調が存在し,口調ごとに特徴的な語彙や語法は膨大に存在するため,文全体の口調の類似性評価は困難なタスクである.そこで本研究では,文章同士の口調の類似性を評価可能な文ベクトル(以下口調ベクトル)を生成する口調埋め込みモデルを提案する.口調埋め込みモデルは,事前学習済みのBERTモデルを対照学習でファインチューニングして構築する.対照学習に必要な類似した口調及び異なる口調の文章ペアは,ウェブ小説中の連続した発話文を利用して大規模に自動収集する.また,Ward法を用いた口調ベクトルのクラスタリングによって,全体的な口調の種類と,各口調での特徴的な語彙や語法について分析する.最後に,発話相手や周囲の状況による同一人物の口調の変化に着目し,小説の登場人物の発話文全体における口調ベクトルのばらつきを分析する.