- 著者
-
山口 晃典
内田 誠一
植竹 朋文
松下 知紀
- 出版者
- 一般社団法人電子情報通信学会
- 雑誌
- 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
- 巻号頁・発行日
- vol.108, no.432, pp.1-6, 2009-02-12
中世代に作成された初期活字印刷本について,文字の形状解析および文字認識手法について検討する.初期活字印刷本中の文字形状には,様々な要因による字形変動が存在し,認識の妨げとなっている.また,既に2値化された画像しか存在しない,対象とする資料以外からは文字情報を得ることができない,などという状況も考えられる.そこで本研究では,2値化された文字画像の最外郭輪郭線の形状に着目し,形状解析および文字認識を行う.具体的には,資料の冒頭数ページから切り出してラベル付けした文字画像を辞書サンプルとして,同カテゴリ内文字の位相変化別変位の抽出,そしてそれらの情報を用いて資料の残りのページから切り出した文字画像に対して認識を行う.この方法により,掠れや途切れを起こしているパターンの情報も利用して文字形状解析・認識を行うことができる.本報告では,実際に実験を行った結果についても述べる.