著者
山田 奨治 梅田 三千雄 川口 洋 柴山 守 加藤 寧 石谷 康人
出版者
国際日本文化研究センター
雑誌
基盤研究(B)
巻号頁・発行日
1999

本研究では、つぎのような成果を得ることができた。1.古文書文字認識手法の基礎的研究古文書文字に特有な文字認識機能と文字切り出し方法について検討した。限定された文字種のデータに対して既存の日本語手書き文字認識技術を適用し、95%を超える認識率が得られることを確認すると同時に、文字切り出し及び正規化に関して新しい手法を開発した。2.古文書文字認識研究のためのデータベース作成古文書文字認識研究を推進するための、25万字に及ぶ古文書文字データベースを完成させ、その一部をすでに公開している。3.古文書解読支援システムのユーザインタフェースの開発古文書解読知識を利用した証文類の翻刻支援システムと古文書翻刻支援のための電子辞書のプロトタイプを実装した。前者はn-gram情報を使って不明文字の正解候補を提示するシステムで、利用試験の結果、その有用性が確認された。後者のプロトタイプには2種類ある。第1は、文字コードからくずし字を検索し、さらに例示された文字と類字した文字をオンラインとオフラインの文字認識技術の応用により検索する機能を持っている。第2のプロトタイプは、タブレット入力された文字と外形が似たくずし字をオフライン文字認識によって検索する機能を持っている。

言及状況

はてなブックマーク (1 users, 2 posts)

[データベース] 2001年までの科研。これと例の「くずし字用例辞典 CD-ROM版」との関係は?
[データベース] 2001年までの科研。これと例の「くずし字用例辞典 CD-ROM版」との関係は?

Twitter (3 users, 3 posts, 2 favorites)

2001年までの科研。これと例の「くずし字用例辞典 CD-ROM版」との関係は? / “KAKEN - 手書き文字OCR技術を援用した古文書翻刻支援システムの開発(11558045)” http://t.co/7pJ3DaZQGm #データベース
@higegeschichte @yusaku_matsu おおお、お持ちの方が! 結局は字体の豊富な解読字典や用例辞典ですか。勉強しないと…。一方で http://t.co/TL6zDgKY http://t.co/B6Es6WTo のような研究の実用化が気になっています。

収集済み URL リスト