著者
下岡 和也 河原 達也 奥乃 博
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.44, pp.81-88, 2002-05-23
参考文献数
12

講演音声のような話し言葉の書き起こしや音声認識結果には、話し言葉特有の表現が数多く含まれて二次利用しにくいため、文章として適した形態に整形する必要がある。本稿では、統計的機械翻訳の考え方に基づいて講演の書き起こしを自動的に整形された文章に変換する方法を提案する。本研究で扱う処理は、フィラーの削除、句点の挿入、助詞の挿入、書き言葉表現への変換、文体の統一である。これらの処理を統合的に行うようにビームサーチを導入した。以上の手法により、実際の講演の書き起こしを整形された文章に変換し、講演録編集者によって一次整形されたものを正解として、句点の挿入、助詞の挿入、文体の統一に関して定量的な評価を行った。Transcriptions and recognition results of lecture speech include many expressions peculiar to spoken language. Thus, it is necessary to transform them into document style for practical use of them. We apply the statistical approach used by machine translation to automatic transformation of the spoken language into document style sentences. We deal with deletion of the fillers, insertion of periods, insertion of particles, conversion to written word expression and unification of a text style. To apply these processings in an integrated manner, we introduce a beam search. The preliminary evaluation of the proposed method is presented using real lecture transcriptions and their archives.
著者
河原 達也 Lee Chin-Hui Juang Biing-Hwang
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション
巻号頁・発行日
vol.96, no.420, pp.61-68, 1996-12-13

対話環境における柔軟な音声理解を実現するために、キーフレーズの検出と検証の組合せに基づくアプローチを提案する。キーフレーズには意味タグが付与されており、その検出が直接的に頑健な理解を実現する。検出の湧出し誤りを抑制するために、サブワードベースの発話検証手法を導入する。これは、認識結果に信頼度を付与するものである。信頼度を定義するいくつかの関数について比較・検討を行った。複数の音声対話タスクのフィールドデータに適用した結果、本手法が、 (1)定型的な発話に対して精度を維持した上で、 (2)非定型な発話に対する理解率を向上し、 (3)タスク外発話の棄却率も改善することが示された。
著者
伊藤亮介 駒谷 和範 河原 達也
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.43, no.7, pp.2147-2154, 2002-07-15
被引用文献数
15

機器操作マニュアルの検索に音声対話インタフェースを適用することで,ユーザフレンドリなヘルプシステムを構築する.本システムでは,まずユーザに自由な発話による検索を許し,キーワード集合を基にマニュアルの項目とマッチングを行うが,この段階では多数の候補が得られる.そこで,機器操作マニュアルから抽出される知識と階層的な構造を利用して対話を行うことにより,ユーザの意図を詳細化し検索結果を絞り込む.効率的に絞り込む質問を生成するために,マニュアルのディレクトリ構造を利用し,3種類のコスト関数を定義した.ビデオデッキのマニュアルに関して14人の被験者に対して実験を行った結果,本対話戦略によってシステムからの質問回数は,単純に尤度の高い候補から確認発話を行う戦略に比べて71%に減少した.We present a user-friendly help system for electrical appliances with speech interface that makes queries to their manuals.Users can make queries by unconstrained speech, from which keywords are extracted and matched to the items in the manual.As a result, so many items are usually obtained.Thus, we introduce an effective dialogue strategy which narrows down the items using a tree structure extracted from the manual.We present three cost functions that minimize the number of dialogue turns.We have evaluated the system performance with 14 subjects on VTR manual task.The number of average dialogue turns is reduced to 71% using our strategy compared with a conventional method that makes confirmation in turn according to the matching likelihood.