著者
曹 宇 佐藤 匡正
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SS, ソフトウェアサイエンス (ISSN:09135685)
巻号頁・発行日
vol.100, no.678, pp.17-22, 2001-03-09

書物など印刷物を電子化するには, OCR文字認識が簡便である. しかし, ルビ文字の混ざっている文書は認字率が低下する. この改善を図るため, 地文とルビ文字を別々に認識させる方式を考案した. この方式においては, 地文とルビの自動的に識別方法が必要となる. ここでは, 「文字寸法」の考えを新たに導入し, この違いによる識別する方法を用いる。本論文では, 文字寸法の特性についての測定結果, システムの実現方法, および試作したシステムの効果について述べる。