著者
今井 亨 シュワルツ リチャード
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.97, no.115, pp.75-82, 1997-06-20
被引用文献数
4

放送ニュース音声あるいはテキストからの話題抽出は、ストーリーの分類や検索、あるいは大語彙連続音声認識における言語的制約への利用が期待できる。本報告では、放送ニュースの各ストーリーから、関連する詳細な話題を複数個、同時に抽出するというタスクを設定し、数千の話題を対象にする。提案する話題混合モデルは、話題が単語毎に遷移し、話題毎の単語出力確率に従って、話題が単語を出力するというモデルであり、どの話題も意味しない一般的な単語を吸収するための特別な話題を持つ。話題混合モデルは一種のHMMであり、EMアルゴリズムによって、各話題は、その話題を直接意味する単語 (キーワード) をより多く出力するように学習される。英語ニュースのテキストおよび音声認識結果を入力とした話題抽出実験において、従来モデルよりも高い話題適合率を示した。