著者
黒沢 由明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.106, no.428, pp.49-54, 2006-12-07
参考文献数
25
被引用文献数
2

本稿は,文字認識技術におけるMCE/GPDの応用について述べたものである.まず,文字認識分野で従来から用いられて来たLVQと,部分空間法の辞書作成手段として提案されたLSM.ALSMを紹介し,それら従来技術とMCE/GPDの関係について述べる.さらに,OCRの特徴抽出機構にMCE/GPDを適用したDFEについて紹介し,最後に再び,LSM,ALSMをMCE/GPDの立場から見た時た時の解釈を検討する.その結果,LSMについてはノルムの割算部分を除いてMCE/GPDで説明できること,ALSMについてはMCE/GPDの立場での説明が難しいことが分かった.
著者
黒沢 由明
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.110, no.467, pp.93-98, 2011-03-03

文字認識や音声認識で良く用いられるLVQは確率降下法の考え方でも説明することができ,これによればLVQを最急降下法による最適解探索問題として定式化することができる.この考え方に立てば,LVQを構成する辞書ベクトル全体を認識パラメータと考え,LVQの学習時に,そのパラメータがパラメータ空間の中をどう動くのかを観察することができる.この手法を使って,ある手書数字認識のケースでたまたま見つかった誤読急減の部位において学習の観測を行なった.その結果,学習パラメータの系列がパラメータ空間内に複数存在する評価関数の渓流状の地形に捕まっていたこと,長い学習の後に渓流が無くなる位置で評価関数の坂を下り落ち始めた事が分かった.それが誤読急減少の原因だったのである.
著者
麻田 治男 黒沢 由明 下辻 成佳
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会ソサイエティ大会講演論文集
巻号頁・発行日
vol.1995, pp.310-311, 1995-09-05

パターン認識の中でも文字認識は最も古くから実用化が進んでいる.文字認識の応用システムとしては汎用のOCR(optical Character Recognition)装置があり,この国内市場は93年度で約300億円,台数にして1万数千台に達している(矢野経済研究所調査).文字認識のもう一つの応用としては郵便物自動区分機があり,近年,手書き漢字認識による宛名読み取り区分機が実用化されている.この二つを見ると,ずいぶんと実用化が進んでいるようであるが,日本語ワードプロセッサの市場(年間約3千億円)と比べると,実用化の度合いは小さいといえる.文書・文字認識と類似技術である図面認識についても第二世代に入って既存図面の入力システムが電力会社などで実用に共されているが,まだ,市場規模を云々するほどは普及していない.また,オンライン文字認識は携帯情報機器などのペン入力に用いられ,期待されてはいるが,仮想キーボード入力のような代替手段に比べて優位な位置は占めていない.このように文書・文字認識の技術はそこそこの実用化はなされているが,長年にわたって伸び悩んでいるというのが実情である.一方では,文書・文字認識に関する国際会議やワークショップが新たに発足するなど,国際的な研究活動の高まりを見せており,社会の真のニーズに沿った研究の方向性を見極める必要がある.本稿は「認識技術の実用化を阻むもの」という大テーマの中で,文書・文字認識について応用範囲を拡大するために何をすべきかを述べる.