著者
山口 晃典 内田 誠一 植竹 朋文 松下 知紀
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.108, no.432, pp.1-6, 2009-02-12

中世代に作成された初期活字印刷本について,文字の形状解析および文字認識手法について検討する.初期活字印刷本中の文字形状には,様々な要因による字形変動が存在し,認識の妨げとなっている.また,既に2値化された画像しか存在しない,対象とする資料以外からは文字情報を得ることができない,などという状況も考えられる.そこで本研究では,2値化された文字画像の最外郭輪郭線の形状に着目し,形状解析および文字認識を行う.具体的には,資料の冒頭数ページから切り出してラベル付けした文字画像を辞書サンプルとして,同カテゴリ内文字の位相変化別変位の抽出,そしてそれらの情報を用いて資料の残りのページから切り出した文字画像に対して認識を行う.この方法により,掠れや途切れを起こしているパターンの情報も利用して文字形状解析・認識を行うことができる.本報告では,実際に実験を行った結果についても述べる.

言及状況

はてなブックマーク (1 users, 1 posts)

収集済み URL リスト