著者
山田 奨治 和泉勇治 加藤寧 柴山 守
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告人文科学とコンピュータ(CH) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.52, pp.43-50, 2002-05-31
被引用文献数
1

古文書の翻刻作業の効率をたかめるためには,標準的なくずし字辞典を電子化し,検索の利便性を向上させることが有効であろう.また,デジタル化された文字画像を使って,ある文字に類似した文字を一覧的に検索することが可能になる.類似文字検索を実現するさいに鍵となるのは,文字の特徴量と文字間の類似度の設定方法である.われわれは,オフライン日本語手書き文字認識技術で使用されている文字特徴量と文字間類似度にストローク情報を加味することで,類似文字検索機能をもった電子くずし字辞典を開発した.Developing an computerized dictionary of histroical characters would be effective to improve the reading speed of historical documents. Using the digitized character images, we can also browse characters similar to an example. A key issue for implementing the search function of the similar characters is how to define the character feature and the similarity between two characters. We developed a computerized historical character dictionary by using some character features and similarities, which are used in Japanese off-line hand-written OCR technology, and using stroke information in addition to them.
著者
井野 英文 猿田 和樹 加藤寧 根元 義章
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.38, no.2, pp.280-289, 1997-02-15
被引用文献数
13

手書き郵便宛名の高精度な認識には 文字切出し 個別文字認識 郵便宛名辞書を用いた知識処理が必要になる.従来 これらの処理を組み合わせた手法が主に報告されているが そのほとんどの場合 単一の筆記具によって書かれた文字を対象としている.文字の平均的な線幅(以下 ストローク幅)がほぼ一定の湯合 接触.入込み文字に対処する手法として 射影ヒストグラムに対し 実際的に求めた闘値により切出し位置を決定する手法が有効であった.しかし 実際の郵便宛名には 筆・サインペン・ボールペン等 様々なストローク幅の文字が存在し これらの手法をそのまま適用するには限界があると考えられる.本論文では 筆記具に依存しない切出し手法として ストローク情報に基づく切出しアルゴリズムを提案する.提案法は ストローク幅 水平方向走査時の文字ストローク交差回数および射影ヒストグラムの変化量という文字ストロークに関する3つの情報を効果的に組み合わせることにより 切出し候補位置を適切に決定する手法である.認識実験では 郵政研究所が配布した手書き宛名サンプル画像を用いて提案法の有効性を示す.また 切出し部に関する評価実験では 提案法が従来法より優れていることを示す.In handwritten address recognition, it's important to segment characters correctly. Conventional methods mainly used fixed threshold to segment characters from handwritten address image. The problem of those methods is that they can not cope with variable stroke width of handwritten characters. In this paper, we propose a new algorithm in which adaptive threshold is used depending on the stroke information of character image. As a result, this algorithm obtained a high recognition rate for the test samples, distributed by Institute for Posts and Telecommunication Policy, MPT.