著者
井上 雅史 安原 龍 菅 郁巳 小坂 哲夫
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

パグリックドメインの映画映像から,複数発話からなる対話区間を自動で抽出し,マルチモーダル対話コーパスを作成した.22ジャンル,1,722本の映画に対して音声検出(VAD)およびルールを適用し,149,689の対話区間を同定した.同定の精度は音楽やミュージカルのジャンルを除き,9割前後であった.大量の対話区間・非対話区間の機械学習のための訓練データや,対話の多様性の分析のために利用可能と考えている.