複数人対話の文字起こしデータを用いた話者名推定手法に関する検討

1 0 0 0 複数人対話の文字起こしデータを用いた話者名推定手法に関する検討

著者: 松尾和哉能登肇深山篤
雑誌: 研究報告自然言語処理(NL) (ISSN:21888779)
巻号頁・発行日: vol.2022-NL-252, no.12, pp.1-7, 2022-06-22

複数の深層学習モデル(顔認識や音声合成など)から成るヒトデジタルツイン(ヒト DT)を元の人間(フィジカルツイン:PT)らしく振舞わせるためには,PT からしか取得できないデータを収集・意味づけし,そのデータを DT に学習させる必要がある.しかし,一つのモデルを作るためには学習データが大量に必要であり,かつその大量のデータが PT ごとに必要になるため,手動で学習データを作成することは非現実的である.そこで本研究では,この学習データの自動生成を目指す.本稿ではまず,顔画像に名前が付与されたデータを映像データから自動的に作成することを目的とし,複数人の対話を文字起こししたデータから,各話者名を推定する手法を提案する.提案手法では,人名が含まれる発言の内容の解析結果と,当該発言の直前直後のターン・テイキングを応用して,話者名を推定する.提案手法の性能を,2 種類の会話コーパスを用いて定量評価を行った.

2022-07-02 21:47:57
1 + 1 Twitter

http://id.nii.ac.jp/1001/00218594/

言及状況

Twitter (1 users, 1 posts, 1 favorites)

複数人対話の文字起こしデータを用いた話者名推定手法に関する検討 - https://t.co/fEDfRjOIrQ #ScholarAlerts

1 @morioka

収集済み URL リスト

https://scholar.google.co.jp/scholar_share?url=https://ipsj.ixsq.nii.ac.jp/ej/?action%3Dpages_view_main%26active_action%3Drepository_view_main_item_detail%26item_id%3D218702%26item_no%3D1%26page_id%3D13%26block_id%3D8&hl=ja&sa=X&ei=eD7AYp3cO-GKywTNqqbwAw&scisig=AAGBfm3fQrdJWXgDr4zgzVox5J2tbdHn4Q (1)