著者
今井 亨 奥 貴裕 小林 彰夫
雑誌
研究報告音声言語情報処理(SLP)
巻号頁・発行日
vol.2011, no.4, pp.1-6, 2011-10-21
被引用文献数
1

テレビ番組の音声を文字で伝える字幕放送は,聴覚障害者や高齢者への重要な情報保障手段の一つである.1985 年の字幕放送開始以来,リアルタイムの日本語文字入力方法が確立されていなかったため,字幕が付与される番組は長い間事前収録番組に限られていた.NHK では,他の研究機関とも連携してニュース音声認識の研究を進め,世界に先駆けて 2000 年に音声認識によるニュース番組のリアルタイム字幕放送を開始した.番組音声を直接認識する本ダイレクト方式の実用化後,スポーツ番組の実況アナウンス等の復唱音声を認識するリスピーク方式の字幕制作システムの実用化などにより,リアルタイム字幕放送は年々拡充されるようになった.また,両方式を併用して認識性能と運用性を高めた,ハイブリッド方式のニュース番組用字幕制作システムの実用化も,現在検討を進めている.本稿では,字幕放送の現状と音声認識を利用した各種字幕制作システムを紹介するとともに,その技術的特徴と実用化の経緯について述べる.Closed-captioning for broadcast, which displays spoken words as texts on the TV screen, is one of important media for the hearing impaired and the elderly. Since starting in 1985, closed-captioning has been provided only to prerecorded TV programs due to lack of a real-time input method of Japanese texts. NHK has done extensive research on speech recognition for news with other research institutes and led the world in real-time closed-captioning for broadcast news by speech recognition in 2000. Besides the direct method recognizing the original program sound, NHK realized a re-speaking method where rephrased utterances by another speaker are recognized for captioning of sports programs, resulting in expansion of live closed-captioning every year. Also a new hybrid method combined with both methods will be put into practical use for more accurate and efficient captioning of news programs soon. This paper introduces current situation of closed-captioning for live broadcast and the real-time closed-captioning systems with their technological features and the ways how they were implemented.