著者
恒川 俊克 山下 洋一 溝口 理一郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.1998, no.12, pp.61-68, 1998-02-05
参考文献数
13
被引用文献数
12

大量のニュース音声データベースからある特定の話題に関するニュースのみを検索しその情報を得るようにするにはニュース音声に対する話題インデキシングの技術が必要になると考えられる。そこで本研究ではニュース音声に対しキーワードスポッティングに基づいた話題のインデキシングを行う。まず話題との相互情報量、単語長を選出基準として、話題の同定に貢献する名詞3000単語をキーワードとして選出した。このキーワードの話題に関する条件付き確率を基にテキストベース上で記事ごとに話題同定の実験を行ったところ約76%の記事を正しく同定することができた。さらにニュース音声に対しスポッティングを行い、抽出されたキーワードの音韻スコアと条件付き確率を基にして話題ごとに「話題の確からしさ」の計算を行い、話題同定を行った。正しい話題が話題同定結果の上位3位以内に含まれていれば正解分類とした場合、約66.5%を正しく同定することができた。For retrieving news data related to a specific topic from a great amount of news data base, we need a technique of indexing speech data with topics. In this report, we try the topic identification for news speech based on keyword spotting. To begin with we selected three thousands of nouns as keywords which contribute to topic identification, based on criterion of mutual information and a length of word. This set of keywords identified correct topics of 76 percent of text article data from newspaper database, Further, we performed keyword spotting for TV news speech and identified a topic by computing possibilities of all topics based on phonetic scores of spotted words and topic probability of the words. Topic identification rate is 66.5 percent assuming that identification is correct if the correct topic is included in the first three places of the result of topic identification.

言及状況

はてなブックマーク (1 users, 1 posts)

[論文][CiNii][音声工学][情報検索]

Twitter (1 users, 3 posts, 1 favorites)

こんな論文どうですか? キーワードスポッティングに基づくニュース音声の話題分類(恒川 俊克ほか),1998 http://t.co/PsNEHS4Y1T
こんな論文どうですか? キーワードスポッティングに基づくニュース音声の話題分類(恒川俊克ほか),1998 http://id.CiNii.jp/MO03L
こんな論文どうですか? キーワードスポッティングに基づくニュース音声の話題分類(恒川俊克ほか),1998 http://id.CiNii.jp/MO03L

収集済み URL リスト