著者
片桐 滋 渡辺 秀行 中村 篤 松田 繁樹 堀 貴明 渡部 晋治
出版者
同志社大学
雑誌
基盤研究(B)
巻号頁・発行日
2010

最小分類誤り学習法のこれまでの性能限界を突破することを目指して,特に,平滑化分類誤り数損失の平滑性が持つ未知標本耐性向上の機構を解明し,その平滑度の自動的最適設定法を開発,さらにカーネル法を組み込んだカーネル型最小分類誤り学習法を開発することで,本学習法の一層の識別力向上を実現した.また,ラウンドロビンデュエル識別法を開発することで,大規模かつ複雑な分類器のための高効率な識別学習法を実現した.
著者
岩田 具治 渡部 晋治 山田 武士 上田 修功
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D, 情報・システム (ISSN:18804535)
巻号頁・発行日
vol.93, no.6, pp.978-987, 2010-06-01
被引用文献数
4

購買ログデータを用いて,時間変化するユーザの興味及び商品の流行を追跡するためのトピックモデルを提案する.提案モデルは,興味や流行の変わりやすさをデータから逐次推定するため,変化に柔軟に対応可能である.また,新たなデータが得られた際,過去のデータで既に推定された興味・流行に基づいて,現在の興味・流行を推定するため,過去のデータを保持する必要がなく記憶容量を削減でき,かつ計算効率も高い.実購買ログデータを用いた実験により,購買行動の予測精度及び推定の計算効率の観点で提案モデルの有効性を示す.
著者
久保 陽太郎 渡部 晋治 中村 篤 小林 哲則
出版者
情報処理学会
雑誌
研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.8, pp.1-6, 2010-02-05

識別学習は,デコーダの出力する認識仮説と比較して正解ラベルの尤度を相対的に高めることで識別に特化したモデルを得るための手法であるが,経験的に過学習しやすいことが知られている.近年,音響モデルの識別学習において過学習を軽減するため,最小相対エントロピー識別が音響モデルの識別学習に導入されてきた.この手法ではパラメタ推定の不確実性をパラメタ分布によって表現することで適切に取り扱うことを可能としており過学習に強いと考えられるが,従来の実現法では大量の認識仮説,および大量のトレーニングデータを取り扱うには膨大な量の計算を単一のコンピュータで実行しなければならなかった.そこで,本研究では,ラティス型認識仮説表現を導入することで認識仮説の数に対する計算効率を,また勾配法に基づく並列化可能な最適化法を導入することでトレーニングデータの数に対する並列計算効率を向上させた.提案法を用いることで,最小相対エントロピー識別学習に必要なステップのほぼ全てがグリッドコンピュータのような並列計算環境で実現可能になり,また,従来の N-best に基づく認識仮説表現では表現しきれないような膨大な数の認識仮説に対する最適化が行なえるようになった.In order to improve the performance of automatic speech recognition, discriminative training methods are introduced for training processes of acoustic models in speech recognizers. Recently, minimum relative entropy discrimination (MRED) training of acoustic models is introduced in order to prevent overfitting problems in discriminative training methods by representing parameters as random variables. Despite of these advantages, the conventional implementation of MRED lacks scalability to the amount of training dataset and the number of the hypothesis label sequences obtained from decoders. In this study, we attempt to improve scalability of MRED training. The lattice-based representations of the hypothesis label sequences are introduced in order to improve scalability due to the number of the hypothesis label sequences. Further, the gradient-based optimization method is introduced in order to ensure parallelism in the MRED training method. By incorpolating proposed methods, it is confirmed that the MRED training procedure can now be performed in parallel computing environments such as grid computers. Furthremore, the large number of the hypothesis label sequences can be handled in the MRED by using hypothesis lattices obtained from decoders.
著者
デルクロア マーク 中谷 智広 渡部 晋治
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション (ISSN:09135685)
巻号頁・発行日
vol.107, no.405, pp.55-60, 2007-12-13

一般に、雑音や残響の影響により音声認識率は低下する。これに対し、音声強調を前処理として用いると、時間的に変化する音響的な歪みをある程度低減することができるが、必ずしも音声認識性能を改善できるとはかぎらなかった。また、モデル適応技術を用いることで、音声強調処理後の音声と音響モデルのミスマッチをある程度低減することができるが、動的なミスマッチについては扱うことはできなかった。音声強調とモデル適応のより最適な組み合わせ法の開発が重要であると考えられる。本稿では、動的なミスマッチについても適切に低減できるモデル適応法を提案する。分散を静的な分散と動的な分散で構成されるパラメトリックモデルで表現し、適応処理に基づき、モデルパラメータを最適化する。実験により、残響除去を前処理として用いた場合に、認識誤りを80%削減できること、およびクリーン音声に近い5.4ることを示す。クリーン音声の場合と近い性能が得られた。