著者
小沼 元輝 朱碧 蘭 山田 奨治 柴山 守 中川 正樹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.106, no.606, pp.91-96, 2007-03-09
被引用文献数
2

本稿では,電子くずし字辞典に用いるロバストな文字認識の開発について述べる.古文書の翻刻作業を特定の専門家以外でも可能にし,その効率を高めるために,古文書で標準的に用いられるくずし字の辞典を電子化し,翻刻の利便性を向上させることが有効である.我々は,67,739種のくずし字に対する認識システムを開発した.くずし字までいかない通常の字体に対しても現有の認識システムを利用できるようにした.採用手法は,現在の文字パターンに対して一定の認識率を保証しているので,実用に耐えることを期待しているが,現実課題のサンプルパターンが少ないために,定量的な評価は今後の課題とする.
著者
持田 桂介 耒代 誠仁 朱 碧蘭 小沼 元輝 中川 正樹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.104, no.741, pp.43-48, 2005-03-10

本稿では, 数式の混在を許容したオンライン手書き文字列認識手法を提案する.文字列認識や数式認識は, それぞれが認識対象とするパターンだけしか入力されないことを前提としている.しかし, 手書きパターン認識の分野では, これらが混在して入力される場合を想定しなければならない.本手法では, すべての数式を一つの文字として日本語文脈構造に取り入れることで, 従来の文字列認識手法に基づいた処理を可能とした.このとき, 元々文字列認識手法に基づいているため, 数式が混在しない文字列に対しても問題なく処理可能である.また, 一文字でも文字列として扱うという考えを拡張し, 数式だけの入力に対しても「数式」という一文字で構成される文字列として扱うことが可能である.