著者
永井 明人 石川 泰 中島 邦男
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.1995, no.73, pp.23-28, 1995-07-20
被引用文献数
7

本稿は、自由発話に対する意味理解と、これを音声認識と統合する手法を述べる。まず、概念を理解単位(概念素)とし、発話を意図の伴った概念素列とみなす意味理解の枠組を提案する。次に、概念素仮説の言語尤度を評価しながら、文節ラティスから概念素を島駆動探索する概念素探索法を述べる。さらに、文意仮説の効率的な探索のために、概念素の脱落を許容して初期文意仮説を高速に得、これより想起される概念素予測知識を利用して脱落区間を再探索し、初期文意仮説を修復する手法を提案する。ホテル予約の自由な質問を対象とした音声理解実験の結果、第一位で92%の良好な理解率を得た。また、高速化手法により理解性能の低下なしに数倍?十倍の効率向上を達成した。This paper describes integration of speech recognition and semantic interpretation for spontaneous speech understanding. First, we propose a framework of semantic interpretation where a concept is a unit of semantic understanding and an utterance is regarded as a sequence of concepts with an intention. Secondly, we describe a basic search method which detects concepts from a phrase lattice by island-driven search evaluating linguistic likelihood of concept hypotheses. Moreover, an improved method to efficiently search for meaning hypotheses is proposed. This method quickly generates initial meaning hypotheses allowing deletion of concepts. Then, the initial meaning hypotheses are repaired by re-searching for missing concepts using prediction knowledge associated with the initial meaning hypotheses. Experimental results show that 92% of understanding rate has been acheived, and that the improved method has realized efficient search without reducing its performance.
著者
永井 明人 増塩 智宏 高山 泰博 鈴木 克志
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.23, pp.125-130, 2003-03-06
参考文献数
9
被引用文献数
1

インターネットでは一般からの情報発信が盛んになり、企業や製品に関する消費者の生の声(風評)が広く公開されるようになった。そこで、これらの大量の風評からクレームを抽出して、迅速なクレーム対応を実現する要求が企業において急速に高まっている。こうした要求を背景として、Web上に広がる企業や製品のクレーム情報を抽出して監視するインターネット情報監視システムを試作した。特徴は、(1) 文内の単語共起照合に基づく精密なクレーム抽出、(2) 収集したクレーム情報をマクロに時系列分析して、クレームの急増を検知するトレンド分析、(3) Web全文検索エンジンと掲示板クローラを組合わせた、大量・最新文書の収集、である。本稿では、この試作システムの概要を述べる。This paper describes an internet watching system which enables to extract consumer claims automatically from an internet. Reputation of enterprises or products latent so far is coming to appear and spread fast in an internet because everyone can send and read many messages easily in the internet. Then, it is highly required to find claims for the enterprises in order to cope with the claims quickly in terms of risk management. So we have developed and prototyped the system which is characterized by technologies of automatic claim extraction, trend analysis of claims and collection of numerous and latest documents.
著者
永井 明人 北 研二 花沢 利行 川端 豪 鹿野 清宏 森元 逞 嵯峨山 茂樹 榑松 明 鈴木 忠 岩崎 知宏 中島 邦男
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.50, no.9, pp.723-729, 1994-09-01
被引用文献数
1

本稿は、大語彙の連続音声認識を実時間で処理するための、HMM-LR連続音声認識装置の設計、処理性能について述べる。HMM-LR法は、一般化LR構文解析により入力音声データ中の音素を予測し、予測された音素の存在確率をHMM音素照合により調べることで、音声認識と言語処理を同時進行させる方式であり、高精度で効率的な処理系を構成することができる。処理量が極めて大きな継続時間制御付きトレリス計算を伴うHMM-LR連続音声認識を実時間で実行するために、本装置は種々の高速化手法を33個のDSPを用いて実現した。その結果、連続文節発声の入力音声に対し、入力文の長さに依らずに、発声終了後から2〜3秒ですべての認識処理を終了する処理速度を達成した。