著者
阿部 悌
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解
巻号頁・発行日
vol.96, no.599, pp.119-126, 1997-03-19
被引用文献数
1

高度化する文書認識/再現技術において文字画像に対して文字コードのみならず、そのフォントやサイズを識別する技術が求められている。フォント識別技術は文書画像の忠実な再現やOCRの辞書の切り替え、キーワードの自動抽出といった応用に対して非常に有用である。本報告では識別対象のフォントを明朝体とゴシック体に限定し、文字種毎の辞書や文字コードの情報を使わずにこれらを識別する方式を提案する。ランレングスヒストグラムやストロークの幅とその変化率、セリフの抽出など様々な特徴量を用いたロバストな方式となっている。本方式を多くの文書画像データベースに対して実験を行ない、その有効性を検証した。