著者
庄境 誠 中村 哲 鹿野 清宏
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.80, no.10, pp.2636-2644, 1997-10-25
被引用文献数
14 3

本論文では, 乗法性ひずみの補正に有効とされているケプストラム平均正規化法(CMN)について考察する. 従来のCMNは単一のケプストラム平均(CM)により正規化を行うため, 実環境に存在する多くの乗法性ひずみ要因を補正するには十分ではない. この問題を解決するため, 話者ごとにかつ音声/非音声で別々に求めたCMを入力ケプストラムから減じる, 新しい方法E-CMNを提案する. この方法は, さまざまな乗法性ひずみを一括して補正し, 入力スペクトルを正規化することが可能である. 更に, 加法性雑音と乗法性ひずみのある実環境に対応するため, E-CMNとHMM合成法を組み合わせた, 新しいモデル適応化手法E-CMN/PMCを提案する. 本方法は, 加法性雑音モデルに対する音声モデルの周波数帯域ごとのゲイン, すなわち, 乗法性ひずみをE-CMNにより音声のCMとして一意に推定できるため, 音声モデルと雑音モデルを繰返し計算なしに加算できるという意味で簡便な方法である. 最後に, E-CMN/PMCの自動車環境内での性能を評価する.
著者
宇田川 健 山崎 裕二 庄境 誠
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ユビキタスコンピューティングシステム(UBI) (ISSN:09196072)
巻号頁・発行日
vol.2005, no.28, pp.179-186, 2005-03-18

赤外線センサは人を検知するセンサで、防犯や自動照明などに広く使われている。中でもパッシブセンサとして使われている焦電センサは、人体が発する赤外線の量を電圧レベルに変換し、閾値判定論理により、人の在不在をON/OFFで出力する。本論は、この焦電センサの電圧レベル(アナログ出力)に対してパターン認識を適用することで、人の在不在だけでなく、さらに詳しい物体の情報を取り出す技術を提案する。今回使用したパターン認識手法は音声認識で広く使用されている隠れマルコフモデル(HMM)で、認識対象は、人の移動方向・少人数での人の識別・人と人以外のカテゴリ認識である。シミュレーションベースでの性能評価においては、いずれも9割以上の認識結果が得られており、新しい焦電センサの使用方法として大いに期待できる技術である。An infrared sensor, widely used for security systems, lighting automation, etc, senses the presence of human. A pyroelectric sensor, the most typical one as a passive type, changes the infrared rays that a human body emits into an analog voltage level. The output of this sensor is usually digital, high means human is present and low means absent, created by plain comparator. Now we suggest the new sensing scheme applying pattern recognition into this analog voltage signal and getting not only human's presence and absence but also the more detailed information about human. In this paper, we describe three experimental results of new sensing scheme using Hidden Markov Model (HMM) currently used for speech recognition, walking direction detection, human identification and human/non-human classification. We get more than 90 percent accuracies in each simulation, and expect to develop the new usage of pyroelectric sensor.
著者
黒岩 眞吾 武田 一哉 井ノ上 直己 野垣内 出 山本 誠一 庄境 誠 尾和 邦彦 長濱 克昌
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. A, 基礎・境界 (ISSN:09135707)
巻号頁・発行日
vol.77, no.2, pp.223-231, 1994-02-25
被引用文献数
6

内線電話への接続をタスクとする音声対話システムを作成した.同システムは200人規模の組識の電話受付業務を行うもので,電話で所属と名前を言うだけで相手の内線に電話をつなぐシステムである.不特定話者の連続音声認識を実時間で行うために専用のハードウェアを開発した.ハードウェアは浮動小数点DSP9個を疎結合マルチプロセッサ方式で結合し,パイプライン処理により,エコーキャンセル,音響分析,HMMのゆう度計算および単語レベル,文法レベルでのビタビ演算を並列に実行する,並列化にあたっては,最も処理の重くなったプロセッサにプロセッサ間のデータ転送に伴う待ち時間が生じないようなパイプラインスケジューリングを行っている.また,タスクサイズが大きくなッた場合でも音響分析は一定の周期で行えるよう同期処理,非同期処理を混在させた構成とした.電話回線経由で収集した400名の発声による音素バランス4,000文を用いて学習した音素モデルを用い実環境で評価したところ,91%の呼に対して正しい相手の内線番号が案内でき,それに要した平均所要時間は41秒であり,多くのユーザによる利用が期待できる性能であることが確認された.