著者
迫江 博昭 千葉 成美
出版者
一般社団法人日本音響学会
雑誌
日本音響学会誌 (ISSN:03694232)
巻号頁・発行日
vol.27, no.9, pp.483-490, 1971-09-10
被引用文献数
33

We consider that the pattern matching method with time-normalizing ability is one of the most effective methods for the spoken word recognition, and that it can well be applied to the recognition of continuously spoken words. Speech can be expressed as a vector-valued time function (1), (2) by appropriate feature extraction. Then, the effect of speaking rate variation can be regarded as non-linear transformation of time axis (3), and can well be compensated by minimizing (4)(Fig. 1). Based on these consideration, we evaluate time-normalized similarity S(A, B) by (5). Calculation of S(A, B) is efficiently carried out using dynamic programming technique (15), (16), (17), (Fig. 3). Utilizing this pattern matching scheme, continuously spoken words can by separated into word units by determining the subpattern A^l which is most similar to the stored reference pattern, or for which S(A^l, B) is minimum (19), . (20), (Fig. 4). Based on this segmentation scheme, three methods to recognize continuously spoken words are proposed. Method-a is direct application of this segmentation scheme. In Metod-b, recognition is carried out by evaluating similarity S(A^l, B_mB_n) between concatenated reference patterns (17) and input pattern, and the amount of computation is considerably reduced using the segmentation scheme and the DP technique(Fig. 5). Method-c is modification of Method-b, where, after recognizing each word, matching window is shifted so that it will be able to cover the timing difference of the next word(Fig. 6). These Methods were extensively examined by computer simulation. Average recognition rate of 99. 8 per cent has been obtained for 2400 utterances of Japanese 1-digit numbers of five speakers, and 99. 6 per cent for total of 500 continuously spoken 2-digit numbers of five male speakers by Method-c(Table 1, 2, 3).
著者
迫江 博昭 アリ ムハマド マスルール 愼 重弼
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
巻号頁・発行日
vol.96, no.384, pp.23-28, 1996-11-21

キューブサーチ法は、迫江らによって提案された、筆順フリーなオンライン文字認識を実現するためのアルゴリズムである。本報告では、その高精度化を図るために画間相互位置情報を利用したキューブサーチ法を提案する。手書き漢字に対して認識実験を行なった結果、従来法に比して高い認識率を得ることができた。画間相互位置情報を利用することの効果が確認された。
著者
慎 重弼 アリ ムハマドマスルール 片山 喜規 迫江 博昭
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
巻号頁・発行日
vol.97, no.325, pp.1-8, 1997-10-17
被引用文献数
1

キューブサーチは筆順自由なオンライン文字認識のために提案された, 画対応のサーチアルゴリズムである. 本論文では, キューブサーチを拡張し, オンライン文字認識における画間相互情報の利用法を提案する. キューブサーチで入力パターンと標準パターンの間で, 画間相互情報を検出し, それを利用することにより精度の高い認識が可能になることを示す. 画数固定で教育漢字882種18035文字をテストパターンとして用いて, 認識実験を行い, 現実的なリソースで実用的に計算できることと, 高い認識能力があることとを示す.
著者
森 明慧 内田 誠一 倉爪 亮 谷口 倫一郎 長谷川 勉 迫江 博昭
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.106, no.606, pp.31-36, 2007-03-09

本報告では,統計的手法を導入した論理判定型DPマッチングによる類似区間検出手法を提案する.論理判定型DPマッチングとは,サポートと呼ばれる論理関数を基準として用いて2つのパターン問の非線形マッチングを行うアルゴリズムであり,パターン間に複数存在する類似区間を同時に検出できるという特長を持つ.この論理判定型DPマッチングに統計的手法を導入することで,パターンの変動のしやすさを考慮したより高精度な類似区間検出が可能になると考えられる.また実際の応用例として,本報告では本手法を用いたジェスチャの基本動作抽出についても検討する.実際に統計的手法の導入による効果を検証するための実験を行った結果,本手法の有効性を示すことができた.
著者
迫江 博昭
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SP, 音声 (ISSN:09135685)
巻号頁・発行日
vol.102, no.530, pp.43-48, 2002-12-13

私のDPマッチング研究の歴史を振り返ってみる.学生時代のDPとの出会い,1968年のDPマッチングの着想,連続単語認識への努力,実用機、DP-100開発での経験を述べる.あわせて最近の研究として,2次元、DPマッチングへの拡張,筆順・続け書きフリーフリーオンライン文字認識への適用等を紹介する.
著者
内田 誠一 迫江 博昭
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 (ISSN:09151923)
巻号頁・発行日
vol.81, no.6, pp.1251-1258, 1998-06-25
被引用文献数
35

2画像間の最大一致を実現する画素間のマッピングとして定義される2次元ワープは, パターンに生じる変形に適応可能なテンプレートマッチング法とみなすことができる.本論文では新しい2次元ワープ法の枠組みを提案し, 基礎的な考察を行う.本手法の第一の特徴は, 2次元的な自由度をもちながら, パターンの位相を保存するワープを構成できることである.この性質はワープに対する単調性および連続性制約により実現される.第2の特徴は, 画像全体での最適性が保証されるように構成された動的計画法(DP)を, 最大一致の探索法として用いる点である.DPの利用により, 評価関数に対する微分可能性の制約がないなどの特長も生じる.実験により, 提案した手法の基本的特性を確認した.
著者
内田 誠一 迫江 博昭
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 (ISSN:09151923)
巻号頁・発行日
vol.83, no.12, pp.2622-2629, 2000-12-25
被引用文献数
16

2画像の最大一致を与える2次元-2次元写像を2次元ワープと呼ぶ.パターン認識の立場から見れば, 2次元ワープは画像の弾性マッチング処理であり, 同時に画素をプリミティブとする構造解析処理でもある.筆者らは単調連続性の条件下で純粋に非線形な2次元ワープを探索する動的計画アルゴリズムを検討してきたが, 計算量が画像サイズの指数オーダとなる問題があった.その改善を目指し, 本論文では区分線形2次元ワープ法を提案する, 本手法では画像の各行のワープによる像は折れ線となる.ワープの最適化はこの折れ線の屈曲点の位置に関して行われる.最適ワープを求めるための計算量は単調連続2次元ワープの場合に比べて大幅に低減される.計算機実験を通じて, 本手法の有効性及び問題点を考察する.
著者
三苫 寛人 内田 誠一 迫江 博昭
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. TL, 思考と言語 (ISSN:09135685)
巻号頁・発行日
vol.103, no.657, pp.13-18, 2004-02-13
被引用文献数
1

DPマッチングなど,いわゆる弾性マッチングに基づくオンライン文字認識においては,合わせ過ぎによる誤認識が発生する.例えば入力パターンが「1」であっても,マッチングによって水平部が非線形伸縮された結果,「7」に誤認識される場合がある.本報告では,こうした誤認識の低減手法を提案する.合わせ過ぎの発生原因には,弾性マッチングが本来そのカテゴリでは起こりえないような変形も吸収の対象としていることが挙げられる.そこで本手法では,あらかじめ各カテゴリに生じ易い変形(固有変形)を統計的手法により求めておき,認識の際のマッチングの結果が,その固有変形からどれぐらい逸脱しているかを評価する.その逸脱量が大きければ,そのマッチングにより合わせ過ぎが起きていると判断できる。オンライン数字データを用いた認識実験により,本手法の有効性を確認した.