著者
森 駿志 大塚 和弘
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 A (ISSN:09135707)
巻号頁・発行日
vol.J105-A, no.10, pp.111-124, 2022-10-01

人と人との対話において対話者が表出する頭部運動には様々な機能があることが知られており,その認識のため畳み込みニューラルネットワーク(CNN) を用いた方法が提案されている.本論文では,対話者個人の頭部運動機能の概念を,頭部運動を介した聞き手・話し手間の相互作用機能へと拡張し,頭部運動機能を認識するCNNを転移させることで相互作用機能を認識するモデルを構築する戦略を提案する.この転移戦略の一つとして,複数の頭部運動機能について各々事前に学習されたCNNを再利用し,これらCNNの中間出力を特徴ベクトルとして抽出し,別の識別器により相互作用機能の認識を行うという戦略が含まれる.話し手・聞き手各々の機能認識CNNの出力について論理積をとる方策を基準として,提案した転移戦略を適用したモデルによる性能向上を検証した結果,話し手のリズム取りに対する聞き手の相槌という相互作用において,F値にて最高8.0ポイントの性能向上を確認し,また,話し手のリズム取りに対する聞き手の正の感情表出という相互作用では,最高13.9ポイントの性能向上を確認した.このように提案した転移戦略の潜在的可能性が確認された.