- 著者
-
柴山 守
笠谷 和比古
加藤 寧
山田 奨治
川口 洋
原 正一郎
並木 美太郎
柴山 守
石谷 康人
梅田 三千雄
- 出版者
- 京都大学
- 雑誌
- 基盤研究(B)
- 巻号頁・発行日
- 2002
本研究は、古文書翻刻支援システム開発プロジェクト(HCRプロジェクト)において、手書き文字OCR技術などを発展的に応用して、古文書文字認識システムの高精度化に関する研究を行うことである。平成14-16年度の研究期間において、主に古文書文字データベースを構築すること、及び日本語文字認識アルゴリズムの適用可能な範囲と問題点を洗い直し、以下の検討課題での研究をすすめ、成果を挙げた。(1)文字切り出し法、及び正規化法について:射影ヒストグラム、文字外形の曲率などの手法を検討し、レイアウト認識では、Hough変換による行抽出方式を提案し、文字データベースの基づく実験を進めた。(2)オフライン文字認識手法について:古文書文字認識に有効と考えられる文字切り出しと文字認識を連携処理させる方法について検討した。非線形正規化手法の研究及び実験を行った。(3)オンライン文字認識手法について:くずし字検索等に適用可能なタブレット入力によるオンライン古文書文字認識手法について検討した。また、『くずし字解読辞典』の文字画像から筆順を推定する手法の研究を行った。本成果は、電子くずし字辞典として平成17年度中に刊行する予定である。(4)東京堂出版『漢字くずし方辞典』の文字パターンを入力し、オンライン検索ソフトウェアの開発を行った。これも上記の(3)に含め、刊行予定である。(5)文字認識用文字パターン辞書として、9種類の古文書文字データベースを公開した。すべてがHCRプロジェクトのホームページは,http//www.nichibun.ac.jp/shoji/hcr/からダウンロード可能である。また、公開したソフトウェアは、2種類GetAMojiマクロ(古文書翻刻中に遭遇する不明文字(ゲタ文字)の正解候補を提示する機能)、及びWeb版GetAMoji(古文書翻刻中に遭遇する不明文字(ゲタ文字)の正解候補を提示する機能のWeb版)である。