著者
嶋 和明 本間 健 池下 林太郎 小窪 浩明 大淵 康成 佘 錦華
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 D (ISSN:18804535)
巻号頁・発行日
vol.J101-D, no.2, pp.446-455, 2018-02-01

電子機器の音声入力操作が一般的になった.音声入力操作に必要となる言語理解器開発のためのコーパスは,主にWOZで収集されてきた.WOZは,人が機械に話すときに見られる簡潔な発話スタイルの収集に向く.しかし,ユーザは,言語理解に優れる機械と対話するなかで,多様な発話をするように変化すると予測される.本研究は,機械相手の簡潔な発話だけでなく将来起こりうる多様な発話も収集することを目的とし,インタビューによるコーパス収集法を提案する.具体的には,カーナビをターゲットとして,質問者から回答者にカーナビに何と言うか質問し,回答を得る.回答者には,機械向けの発話収集であり,かつ機械は進化しているため発話の制限がないことを教示する.インタビューで得たコーパスと現製品の発話ログデータ(製品ログ)を比較したところ,コーパスが一発話あたり11.7%多く形態素を含み,多様な発話を収集できたことを確認した.また,現製品の言語理解用データとしての有用性を調べるため,コーパス,製品ログ,両者混合の3パターンで学習させた言語理解器を構築し,評価した結果,両者混合学習で最高精度となり,有用性を確認した.
著者
小窪 浩明 畑岡 信夫 李晃伸 河原 達也 鹿野 清宏
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.50, no.11, pp.2597-2606, 2009-11-15
被引用文献数
1

PC向け連続音声認識プログラムJuliusのSuperHマイコン(SH-4A)への搭載に関して行った処理の高速化と,評価実験について報告する.計算リソースの限られたマイコン上で動作させるため,仮説探索時のメモリ管理の最適化や音響尤度計算の高速化を実施した.語彙数5,000語での評価実験では,最適化前のJuliusの実行速度に対して3.7倍の高速化を実現し,SH-4A上での実時間動作を達成した.また,語彙数20,000単語での評価でも実時間の1.25倍で動作すること確認した.最後に,応用アプリケーションとしてT-Engine上に実装した質問応答システムについて報告する.To expand CSR (continuous speech recognition) software to the mobile environmental use, we have developed embedded version of Julius (Embedded Julius). In this paper, we describe an implementation of the "Embedded Julius" on a SH-4A microprocessor. SH-4A is a high-end MPU with on-chip FPU. However, further computational reduction is necessary for the CSR software to operate real-time. Applying some optimizations (efficient memory management, modified GMS), the "Embedded Julius" achieves real-time processing on the SH-4A. The experimental results show 0.73 x real-time, resulting 3.7 times faster than baseline CSR. We also evaluated the "Embedded Julius" on a large vocabulary task (20,000 words). It shows almost real-time processing (1.25 x RT). Finally, We introduced Q & A guidance systems developed for embedded applications.
著者
小窪 浩明 匂坂 芳典 鈴木 紀子 岡田 美智男
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声
巻号頁・発行日
vol.96, no.93, pp.81-88, 1996-06-14
被引用文献数
1

自然な発話における多様な挙動をとらえるために,有機的な振る舞いに基づいたパージングアーキテクチャ,Situated Parserを提案Lた.このSituated Parserは,局所的な制約間での協調/競合作用の中から有機的に創発される秩序によって,次にとる動作が動的に決定されるという特徴をもつ.したがって,従来のパーザのように言語の多様性に合わせた手続き的な記述を必要とせず,より柔軟なパージングを行うことが可能となる.本稿では,このSituated Parserの動作メカニズムを説明するとともに,この特徴として,局所的な制約に基づく有機的な振る舞いと多重ゴールについて述べる.また,実験による動作例を検証し,局所的な制約による自律的な振る舞いによって,複数の仮説の中からいちばん尤もらしい仮説が優先的に生成され,手続き的な制御なしにパージングが行われることを示す.