著者
松尾 和哉 能登 肇 深山 篤
雑誌
研究報告自然言語処理(NL) (ISSN:21888779)
巻号頁・発行日
vol.2022-NL-252, no.12, pp.1-7, 2022-06-22

複数の深層学習モデル(顔認識や音声合成など)から成るヒトデジタルツイン(ヒト DT)を元の人間(フィジカルツイン:PT)らしく振舞わせるためには,PT からしか取得できないデータを収集・意味づけし,そのデータを DT に学習させる必要がある.しかし,一つのモデルを作るためには学習データが大量に必要であり,かつその大量のデータが PT ごとに必要になるため,手動で学習データを作成することは非現実的である.そこで本研究では,この学習データの自動生成を目指す.本稿ではまず,顔画像に名前が付与されたデータを映像データから自動的に作成することを目的とし,複数人の対話を文字起こししたデータから,各話者名を推定する手法を提案する.提案手法では,人名が含まれる発言の内容の解析結果と,当該発言の直前直後のターン・テイキングを応用して,話者名を推定する.提案手法の性能を,2 種類の会話コーパスを用いて定量評価を行った.

言及状況

Twitter (1 users, 1 posts, 1 favorites)

複数人対話の文字起こしデータを用いた話者名推定手法に関する検討 - https://t.co/fEDfRjOIrQ #ScholarAlerts

収集済み URL リスト