著者
勝丸徳浩 秋田 祐哉 森 信介 河原 達也
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.68, pp.25-30, 2008-07-11
被引用文献数
5

我々は,大学の講義におけるノートテイク支援を目標とした音声認識システムの研究開発を行っている.本研究では,専門性の高い講義に対して,言語モデルを効率的に適応する方法を検討する.大学の講義では,同一の講師が同一科目を一定期間担当することが通例であるので,以前の講義のデータを活用することを考える.ノートテイクが音声認識結果を評価・選別する応用場面を想定して,認識結果を教師ありで言語モデル適応に用いる方法と,音声認識結果の信頼度に基づいて教師なしで適応する方法を検討する.さらに,講義スライドを用いて, PLSA や Web テキスト収集に基づいて適応する手法との統合も行い,効果を確認した.We are developing an automatic speech recognition (ASR) system to assist note-taking in the classroom. In this work, we focus on an efficient method to adapt the language model (LM) for ASR to university lectures, in which a number of technical terms are used. We assume that one lecturer teaches a specific course subject through a certain period (a semester), and exploit the data of the lectures previously given by the same lecturer. Specifically, we propose an LM adaptation scheme supervised by the note-takers, who verify the ASR results and filter the well-recognized hypotheses. We also investigate an unsupervised adaptation method based on the confidence score of ASR. The methods are combined with other LM adaptation methods based on PLSA and Web text collection using the lecture slides.