著者
松尾 和哉 能登 肇 深山 篤
雑誌
研究報告自然言語処理(NL) (ISSN:21888779)
巻号頁・発行日
vol.2022-NL-252, no.12, pp.1-7, 2022-06-22

複数の深層学習モデル(顔認識や音声合成など)から成るヒトデジタルツイン(ヒト DT)を元の人間(フィジカルツイン:PT)らしく振舞わせるためには,PT からしか取得できないデータを収集・意味づけし,そのデータを DT に学習させる必要がある.しかし,一つのモデルを作るためには学習データが大量に必要であり,かつその大量のデータが PT ごとに必要になるため,手動で学習データを作成することは非現実的である.そこで本研究では,この学習データの自動生成を目指す.本稿ではまず,顔画像に名前が付与されたデータを映像データから自動的に作成することを目的とし,複数人の対話を文字起こししたデータから,各話者名を推定する手法を提案する.提案手法では,人名が含まれる発言の内容の解析結果と,当該発言の直前直後のターン・テイキングを応用して,話者名を推定する.提案手法の性能を,2 種類の会話コーパスを用いて定量評価を行った.
著者
松村 誠明 亀田 明男 磯貝 愛 能登 肇 木全 英明
雑誌
研究報告オーディオビジュアル複合情報処理(AVM) (ISSN:21888582)
巻号頁・発行日
vol.2018-AVM-101, no.10, pp.1-5, 2018-05-31

スタジアムやアリーナではスポーツを観戦する観客に対し,より試合に熱中いただくため,会場では様々な演出が行われる.これら演出は,熱中度低い観客に対しては楽しみ方の気付きを与えるような演出が望ましく,熱中度が高い観客に対してはより会場全体と一体になれるような演出が望ましい.本研究では,観客の熱中状態を判断する材料として興奮 ・ 緊張状態に着目し,観客の挙動を波と捉え,周波数変換したデータを基に興奮度や緊張度を推定する技術を構築したので報告する.