著者
堀 智織 加藤 正治 伊藤 彰則 好田 正紀
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-2, 情報・システム 2-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.11, pp.2407-2417, 2000-11-25
参考文献数
9
被引用文献数
9

本論文では, 確率文脈自由文法(Stochastic Context Free Grammar:SCFG)を大語彙連続音声認識に適用する手法として, 文節単位の係り受け制約をもつSCFGを提供する.SCFGは, N-gramのような局所的な制約だけでなく, 文全体にわたる大局的な制約をも記述できることから, 非常に表現力の高い言語モデルとして知られている.しかし, SCFGのパラメータ推定にはInside-Outsideアルゴリズムを用いる必要があり, 非終端記号数の3乗, かつ入力系列長の3乗に比例する莫大な計算量を要する.そのため, SCFGは大量のテキストコーパスから推定することが難しく, これまで大語彙連続音声認識用の言語モデルとして利用されることはほとんどなかった.提案する文節単位の係り受けSCFGは, Inside-Outsideアルゴリズムの計算量を係り受けの制約により非終端記号数の2乗に, 文節単位の導入により更にその約1/8に削減できる有効なモデルである.EDRコーパスを用いた実験では, 提案法を含む各種SCFGの性能とパラメータ推定に要する処理量を比較し, 提案法が計算量を大幅に削減しつつ, パープレキシティがほとんど増加しいことを示す.毎日新聞コーパスを用いた実験では, 大規模な文節単位の係り受けSCFGを構築し, 大語彙連続音声認識システムに実装する.そして, 語彙サイズ5000の音声認識実験を行い, SCFGによる認識性能はTrigramには及ばないものの, Trigramと併用した場合にはTrigram単独の場合に比べて約14%の単語誤りを削減できることを示す.
著者
菊池 智紀 古井 貞煕 堀 智織
雑誌
情報処理学会研究報告音声言語情報処理(SLP)
巻号頁・発行日
vol.2002, no.121(2002-SLP-044), pp.225-230, 2002-12-16

本稿では,これまで我々が提案してきた単語抽出による要約手法の前処理として,重要文抽出を組み合わせた2段階の音声自動要約手法を提案する.本手法では音声認識の結果から,各文の構成単語の重要度,信頼度,言語的自然さの評価値から重要文抽出の要約スコアを求め,それをもとに認識率の低い文,理解困難な文をあらかじめ除いておく.次に,残された文に対して,同様の評価値に単語間遷移スコアを加えた要約スコアを最大にするような,部分単位列を抽出するという手法により要約文を作成し,高精度化をはかる.この手法を用いて講演音声を自動要約し,複数の被験者により作成された正解要約文単語ネットワークに基づく評価を行う.重要文抽出法を用いない従来までの要約手法との要約精度の比較を行った結果,提案手法の有効性が確認された.
著者
篠田 浩一 堀 貴明 堀 智織 篠崎 隆宏
雑誌
研究報告音声言語情報処理(SLP)
巻号頁・発行日
vol.2014-SLP-100, no.2, pp.1-6, 2014-01-24

情報処理学会音声言語情報処理 (SLP) 研究会が 100 回を迎えた.音声認識・理解はこの 20 余年の間に当初は予想もできないほど飛躍的な進歩を遂げた.本研究会は日本における音声認識・理解研究の議論・発表の場としてその進歩に大きく貢献してきた.本稿では,この記念すべき 100 回目の研究会における一連の企画の 1 つとして,この 100 回の歩みを踏まえた上で,今後音声認識・理解研究が進むべき方向性について,4 人の研究者が提言を行う.
著者
翠 輝久 大竹 清敬 堀 智織 河井 恒 柏岡 秀紀 中村 哲
雑誌
研究報告音声言語情報処理(SLP)
巻号頁・発行日
vol.2011, no.10, pp.1-6, 2011-07-14

ユーザがシステムから情報提示を受けながら候補を選択する意志決定型の音声対話システム構築と被験者実験の結果を報告する.これまで我々は,意志決定対話を部分観測マルコフ過程 (POMDP) としてモデル化し,ユーザの意志決定の良さを最大化するための対話戦略の最適化を行ってきた.本稿では,提案モデルを用いた対話制御手法と複数のベースライン手法とを被験者実験により評価した結果を報告し,ユーザシミュレーション環境で有効性を確認した提案手法が,実ユーザを対象とした場合でも有効であることを示す.This paper presents the results of the user evaluation of spoken decision support dialogue systems, which help users select from a set of alternatives. Thus far, we have modeled this decision support dialogue as a partially observable Markov decision process (POMDP), and optimized its dialogue strategy to maximize the value of the user's decision. In this paper, we present a comparative evaluation of the optimized dialogue strategy with several baseline strategies, and demonstrate that the optimized dialogue strategy that was effective in user simulation experiments works well in an evaluation by real users.