著者
水野 淳太 緒方 淳 後藤 真孝
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.46, pp.31-38, 2008-05-15

本稿では,エピソードと呼ばれる音声ファイルの集合から成るポッドキャスト(音声ブログ)を対象とした,類似エピソードの検索手法について述べる.動画共有サイト等で,あるコンテンツの再生後に関連・類似したコンテンツを提示する機能を持つものが多いが,それらは書誌情報やタダユーザの視聴履歴に基づいている.本稿では,エピソードを音声認識した結果に基づいて,音声認識結果を confusion network に変換し,そこからエピソードを特徴づけるキーワードセットを抽出して,キーワードセット間の類似度を計算することで,関連エピソードを検索・提示できる手法を提案する.単語正解率や話者数など,傾向の異なるいくつかのエピソードに対して実験を行い,本手法がどのような場合に有効であるかについて評価を行った.本成果は,音声認識に基づくポッドキャスト検索サービス PodCastle で,関連エピソードを提示するためにも利用できる.Given podcasts (audio blogs) which are sets of speech files called episodes, this paper describes a method for retrieving similar episodes. Although video sharing services usualy have a function of showing a set of relevant /similar content after playing back a piece of content, they are based on bibliographic information, tags, and users' playback behaviours. In this paper, we propose a method that extracts keywords from confusion networks converted from speech recognition results and then retrieves and shows relevant episodes on the basis of similarity between those keywords. We evaluated this method using several episodes including a variety of speech recognition accuracy and the number of speakers. This result can be applied to show relevant episodes on PodCastle, a podcast search service based on speech recognition.

言及状況

はてなブックマーク (1 users, 1 posts)

Twitter (1 users, 1 posts, 0 favorites)

これ読んでる http://t.co/Ek5PBFia

収集済み URL リスト