著者
堀 貴明 塚田 元
出版者
一般社団法人情報処理学会
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.45, no.10, pp.1020-1026, 2004-10-15
参考文献数
6
被引用文献数
1

音声認識技術の進展に伴い,数万単語以上の語彙を扱う音声認識が汎用のパーソナルコンピュータ上で動作するようになった.この背景には,これまでに培われた音声認識アルゴリズムの効率化に関する数々の研究成果がある.しかし,その一方で音声認識のアルゴリズムは複雑化し,システムの保守・拡張が困難になる傾向があった.近年,このような従来手法に代わるアプローチとして,重み付き有限状態トランスデューサ(Weighted Finite-State Transducer: WFST)による音声認識が注目を集めている.WFSTは確固たる理論に支えら,拡張性の高いシステムの構築と従来手法を凌ぐ高速な音声認識を実現する.本稿では,WFSTによる音声認識を紹介し,従来の音声認識との相違点を明らかにする.さらに,WFSTによってもたらされる音声認識の今後の展開について述べる.
著者
堀 貴明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.111, no.153, pp.35-40, 2011-07-14

本稿では,音声認識アルゴリズムの最近の進展について概説する.音声認識に関連するアルゴリズムは数多く存在するが,本稿では入力音声に対して最も尤もらし単語列を探索するデコーダ技術に着目する.近年の大語彙連続音声認識のデコーダは時間同期Viterbiビーム探索がベースとなっており,多くの場合,音響モデルには隠れマルコフモデル,言語モデルには単語Nグラムが用いられる.そして,このデコーダを動作させる現在最も有力なアプローチは重み付き有限状態トランスデューサ(Weighted Finite-State Transducer: WFST)による音声認識である.本稿ではWFSTを中心に近年のデコーダ技術を紹介すると共に,コンセンサスデコーディング,並列化,探索最適化,テンプレートベース音声認識といったWFST以外の話題にも触れ,今後のデコーダ技術の展望について述べる.
著者
篠田 浩一 堀 貴明 堀 智織 篠崎 隆宏
雑誌
研究報告音声言語情報処理(SLP)
巻号頁・発行日
vol.2014-SLP-100, no.2, pp.1-6, 2014-01-24

情報処理学会音声言語情報処理 (SLP) 研究会が 100 回を迎えた.音声認識・理解はこの 20 余年の間に当初は予想もできないほど飛躍的な進歩を遂げた.本研究会は日本における音声認識・理解研究の議論・発表の場としてその進歩に大きく貢献してきた.本稿では,この記念すべき 100 回目の研究会における一連の企画の 1 つとして,この 100 回の歩みを踏まえた上で,今後音声認識・理解研究が進むべき方向性について,4 人の研究者が提言を行う.
著者
片桐 滋 渡辺 秀行 中村 篤 松田 繁樹 堀 貴明 渡部 晋治
出版者
同志社大学
雑誌
基盤研究(B)
巻号頁・発行日
2010

最小分類誤り学習法のこれまでの性能限界を突破することを目指して,特に,平滑化分類誤り数損失の平滑性が持つ未知標本耐性向上の機構を解明し,その平滑度の自動的最適設定法を開発,さらにカーネル法を組み込んだカーネル型最小分類誤り学習法を開発することで,本学習法の一層の識別力向上を実現した.また,ラウンドロビンデュエル識別法を開発することで,大規模かつ複雑な分類器のための高効率な識別学習法を実現した.