- 著者
-
河原 達也
李 晃伸
小林 哲則
武田 一哉
峯松 信明
伊藤 克亘
伊藤 彰則
山本 幹雄
山田 篤
宇津呂 武仁
鹿野 清宏
- 出版者
- 一般社団法人日本音響学会
- 雑誌
- 日本音響学会誌 (ISSN:03694232)
- 巻号頁・発行日
- vol.55, no.3, pp.175-180, 1999-03-01
- 被引用文献数
-
39
「日本語ディクテーション基本ソフトウェア」は, 大語彙連続音声認識(LVCSR)研究・開発の共通プラットフォームとして設計・作成された。このプラットフォームは, 標準的な認識エンジン・日本語音響モデル・日本語言語モデルから構成される。音響モデルは, 日本音響学会の音声データベースを用いて学習し, monophoneから数千状態のtriphoneまで用意した。語彙と単語N-gram(2-gramと3-gram)は, 毎日新聞記事データベースを用いて構築した。認識エンジンJULIUSは, 音響モデル・言語モデルとのインタフェースを考慮して開発された。これらのモジュールを統合して, 5,000語彙の日本語ディクテーションシステムを作成し, 種々の要素技術の評価を行った。本ツールキットは, 無償で一般に公開されている。