著者
久保 陽太郎 渡部 晋治 中村 篤 小林 哲則
出版者
情報処理学会
雑誌
研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2010, no.8, pp.1-6, 2010-02-05

識別学習は,デコーダの出力する認識仮説と比較して正解ラベルの尤度を相対的に高めることで識別に特化したモデルを得るための手法であるが,経験的に過学習しやすいことが知られている.近年,音響モデルの識別学習において過学習を軽減するため,最小相対エントロピー識別が音響モデルの識別学習に導入されてきた.この手法ではパラメタ推定の不確実性をパラメタ分布によって表現することで適切に取り扱うことを可能としており過学習に強いと考えられるが,従来の実現法では大量の認識仮説,および大量のトレーニングデータを取り扱うには膨大な量の計算を単一のコンピュータで実行しなければならなかった.そこで,本研究では,ラティス型認識仮説表現を導入することで認識仮説の数に対する計算効率を,また勾配法に基づく並列化可能な最適化法を導入することでトレーニングデータの数に対する並列計算効率を向上させた.提案法を用いることで,最小相対エントロピー識別学習に必要なステップのほぼ全てがグリッドコンピュータのような並列計算環境で実現可能になり,また,従来の N-best に基づく認識仮説表現では表現しきれないような膨大な数の認識仮説に対する最適化が行なえるようになった.In order to improve the performance of automatic speech recognition, discriminative training methods are introduced for training processes of acoustic models in speech recognizers. Recently, minimum relative entropy discrimination (MRED) training of acoustic models is introduced in order to prevent overfitting problems in discriminative training methods by representing parameters as random variables. Despite of these advantages, the conventional implementation of MRED lacks scalability to the amount of training dataset and the number of the hypothesis label sequences obtained from decoders. In this study, we attempt to improve scalability of MRED training. The lattice-based representations of the hypothesis label sequences are introduced in order to improve scalability due to the number of the hypothesis label sequences. Further, the gradient-based optimization method is introduced in order to ensure parallelism in the MRED training method. By incorpolating proposed methods, it is confirmed that the MRED training procedure can now be performed in parallel computing environments such as grid computers. Furthremore, the large number of the hypothesis label sequences can be handled in the MRED by using hypothesis lattices obtained from decoders.
著者
ニラウラ マダン 中村 篤志 青木 徹 畑中 義式
出版者
一般社団法人映像情報メディア学会
雑誌
映像情報メディア学会技術報告 (ISSN:13426893)
巻号頁・発行日
vol.25, no.19, pp.25-30, 2001-02-23
被引用文献数
4

ガンマ線計測とその画像応用の目的でCdTe単結晶を用いた核放射線検出器を作製し、その動作特性を報告する。この検出器はp-i-nダイオード構造をもち、n型CdTeは単結晶CdTe上にプラズマを利用したMOCVD法によりエピタキシャル成長法によって、沃素を不純物として添加し作製した。p型は金を電極とすることによりショットキー接合とした。この検出器でコバルト57の122keVのガンバ線に対して半値幅1.7keV(1.3%)の値を得た。また、画像検出のために、p型領域をエキシマレーザーによりストライプ状にドーピングするレーザードーピング法を開発した。これらの結果は、画像検出器に応用するのに良い指針を示した。
著者
青木 徹 中村 篤志 浅野 浩司 ニラウラ マダン 中西 洋一郎 畑中 義式
出版者
一般社団法人映像情報メディア学会
雑誌
映像情報メディア学会技術報告 (ISSN:13426893)
巻号頁・発行日
vol.26, no.40, pp.1-6, 2002-06-18

M-π-n type Multi-pixel CdTe high-energy radiation detectors were fabricated by excimer laser processing technique combined excimer laser pattern doping with laser ablation method. The strip detectors showed high-energy resolution and uniform peak levels. The color high-energy radiation images colored by peak energy were obtained with high-energy resolution by 128pixel CdTe detector with ASIC chips.
著者
道 健一 山下 夕香里 片岡 竜太 中村 篤 高橋 浩二 斎藤 健一 IMAI Satoko 山下 夕香理 今井 智子
出版者
昭和大学
雑誌
一般研究(B)
巻号頁・発行日
1988

臨床応用可能な開鼻声の定量的評価法を確立するために、口蓋裂あるいは先天性鼻咽腔閉鎖不全症による開鼻声患者18例と健常人17例の発声した母音/i/にケプストラム分析を行い、得られたスペクトルエンベロ-プに1/3オクタ-ブ分析を加え、開鼻声の周波数特性を求めた。次に20人の聴取者による開鼻声の聴覚心理実験を行い、得られた主観評価量と周波数特性を表わす物理量の関連を検討したところ次の結果が得られた。1 健常音声と比較した開鼻声のスペクトルエンベロ-プの特徴は第1、第2フォルマント間のレベルの上昇と、第2、第3フォルマントを含む帯域のレベルの低下であった。2 開鼻声の聴覚心理実験を行い得られた5段階評価値を因子分析したところ、開鼻声を表現する2次元心理空間上に2つの因子が存在し、第1因子は全聴取者に共通した聴覚心理上の因子であり、第2因子は聴取者間の個人差を表わす因子であると考えられた。そのうち第1因子を主観評価量とした。3 開鼻声の主観評価量とスペクトルエンベロ-プの1/3オクタ-ブ分析から得られた物理量の相関を検討したところ、第1フォルマントの含まれる帯域から2/3〜4/3オクタ-ブ帯域の平均レベル(物理評価量L1)および9/3〜11/3オクタ-ブの帯域の平均レベル(物理評価量L2)と主観評価量に高い相関が認められた。