音響・言語適応処理を用いたスポーツ実況中継音声の認識 : ハイライトシーン検出への応用

1 0 0 0 音響・言語適応処理を用いたスポーツ実況中継音声の認識 : ハイライトシーン検出への応用

著者: 重森猛金子剛志緒方淳藤本雅清有木康雄塚田清志濱口伸清瀬基
出版者: 一般社団法人電子情報通信学会
雑誌: 電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日: vol.102, no.618, pp.33-40, 2003-01-23
参考文献数: 14
被引用文献数: 6

本研究では、野球のラジオ実況中継音声に対して大語彙連続音声認識を行い、キーワードを抽出してハイライトシーンを検出することを目的としている。音声認織部をより頑健にするために、音響モデルでは、MLLR+MAP適応による教師あり、教師なし適応を行っている。この音響モデルの2段階適応を用いることにより、アナウンサーの話者性に適応することができ、ベースラインに比べ単語正解精度で約28%の改善が得られた。言語モデルでは、言語モデルの融合、選手名のクラス化、発音辞書の修正を行い、ベースラインに比べ単語正解精度で約13%の改善が得られた。それぞれの適応を統合することにより、単語正解精度で約38%の改善が得られた。

2011-06-05 14:30:19
1 + 0 Twitter

https://ci.nii.ac.jp/naid/110003295615

言及状況

Twitter (1 users, 1 posts, 0 favorites)

こんな論文どうですか？音響・言語適応処理を用いたスポーツ実況中継音声の認識 : ハイライトシーン検出への応用(重森猛ほか),2003 http://id.CiNii.jp/NzVFL

収集済み URL リスト

https://ci.nii.ac.jp/naid/110003295615 (1)