著者
本間 真一 松井 淳 佐藤 庄衛 小早川 健 尾上 和穂 今井 亨 安藤 彰男
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.102, no.160, pp.49-54, 2002-06-21
被引用文献数
11

NHKは,音声認識技術を利用したニュース番組の生字幕放送をすでに実現しているが,スポーツなどの生放送番組については,背景雑音や発話スタイル等の問題があるため,直接その番組音声に対してリアルタイムで音声認識を行うことは困難である.そこで我々は,「リスピーカー(re-speaker)」と呼ばれる話者を起用し,この話者が番組音声を聞きながらその内容を言い直し,その声を音声認識することにより生放送番組の字幕放送を実現した.本稿では,ソルトレークシティーオリンピックの生中継において実際に使用された生字幕放送ための音声認識システムと,新たに構築した言語モデルおよび音響モデルの概要を説明する.また,音声認識率やテストセットパープレキシティーなどをもとに,リスピーカーによる言い直しの効果について報告する.

言及状況

Twitter (1 users, 1 posts, 0 favorites)

こんな論文どうですか? 生字幕放送のための音声認識 : システムの概要とリスピークの効果(本間 真一ほか),2002 http://t.co/Es3DvhSJ

収集済み URL リスト