著者
山田 奨治 和泉勇治 加藤寧 柴山 守
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告人文科学とコンピュータ(CH) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.52, pp.43-50, 2002-05-31
被引用文献数
1

古文書の翻刻作業の効率をたかめるためには,標準的なくずし字辞典を電子化し,検索の利便性を向上させることが有効であろう.また,デジタル化された文字画像を使って,ある文字に類似した文字を一覧的に検索することが可能になる.類似文字検索を実現するさいに鍵となるのは,文字の特徴量と文字間の類似度の設定方法である.われわれは,オフライン日本語手書き文字認識技術で使用されている文字特徴量と文字間類似度にストローク情報を加味することで,類似文字検索機能をもった電子くずし字辞典を開発した.Developing an computerized dictionary of histroical characters would be effective to improve the reading speed of historical documents. Using the digitized character images, we can also browse characters similar to an example. A key issue for implementing the search function of the similar characters is how to define the character feature and the similarity between two characters. We developed a computerized historical character dictionary by using some character features and similarities, which are used in Japanese off-line hand-written OCR technology, and using stroke information in addition to them.