著者
緒方 淳 後藤 真孝 江渡 浩一郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP)
巻号頁・発行日
vol.2007, no.11, pp.41-46, 2007-02-09
被引用文献数
7

本稿では、ポッドキャストを検索できる Web サービス「PodCastle」を実現するための音声認識手法について述べる。ポッドキャストでは多様な内容が異なる環境で録音されており、多数の未知語を含む新たな話題も多いため、従来の音声認識システムで適切に認識するのは困難だった。この問題を解決するために、本研究では、Web 2.0 によって得られる様々なデータを用いることによって、継続的に、音声認識システムを改善していく。具体的には、各ポッドキャストの内容に応じた言語モデルの話題適応、Web 2.0 のサービスを通じた単語発音の自動獲得、PodCastle 上でのユーザが音声認識誤りを訂正した結果を用いた未知語の学習等を試みた。実際にポッドキャストを対象とした認識実験を行い、性能向上に有効であることを確認した。This paper describes speech recognition techniques that enable a web service "PodCastle" for searching podcasts. Most previous speech recognizers had difficulties dealing with podcasts because they include various contents recorded in different conditions and new topics with many out-of-vocabulary words. To overcome such difficulties, we continuously improve speech recognizers by using information aggregated on the basis of Web 2.0. For example, the language model is adapted to a topic of the target podcast on the fly, the pronounciation of unknown words is obtained from a Web 2.0 service, and out-of-vocabulary words are automatically acquired by analyzing user corrections of speech recognition errors on PodCastle. The experiments we report in this paper show that our techniques produce promising results for podcasts.

言及状況

Twitter (3 users, 3 posts, 6 favorites)

ワタシは産総研が2008年からやってた「Podcastle」に期待していたのだけど、実験サイトが止まっちゃったんだよね/インターネット上の動画音声データの検索・書き起こしシステムを実現 https://t.co/FfR6oqTnNL https://t.co/vWDwpY1QoW
こんな論文どうですか? PodCastleの実現 : Web 2.0に基づく音声認識性能の向上について(セッション2 : 理解るインタフェース : 音声+ソーシャル+コミュニティ)(緒方淳ほか),2007 http://id.CiNii.jp/aHQ4L

収集済み URL リスト