著者
飯野 雄一郎 荒川 涼 長岡 弘祥 中田 充 葛 崎偉
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. MSS, システム数理と応用 (ISSN:09135685)
巻号頁・発行日
vol.113, no.466, pp.69-72, 2014-02-27

本稿では,翻刻・本文校訂が行われていない手書きの和文歴史資料を対象とした古文書画像検索システムについて述べる.このシステムでは,画像データは古文書の各行に書かれた文字の形状を表現する特徴グラフ(文書グラフ)と共に格納される.利用者は,所望する文字列の形状を特徴グラフ(検索グラフ)で指定する.システムは,検索グラフに類似した部分グラフを含む文書グラフを検索することで,所望された文字列に類似した部分領域を含む古文書画像を得る.文書グラフの検索において,利用者は検索グラフに加えて検索結果に必ず含まれなければならない必須構造を指定する.
著者
福田 竜三 荒川 涼 中田 充 葛 崎偉 吉村 誠
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. MSS, システム数理と応用 (ISSN:09135685)
巻号頁・発行日
vol.111, no.294, pp.41-46, 2011-11-10

筆者らはこれまでに,続け字を含む日本語文字列を対象とした,特徴グラフに基づいた文字認識手法を提案している.特徴グラフとは文字の構造を表現するグラフである.この認識手法では,既知文字の必須構造と同型となる認識対象文字列の特徴グラフの同型部分グラフを見つけることで認識対象文字列の部分領域を切り出し,その領域と既知の文字との間の類似度を求めることで文字を認識する.本稿では,文字幅が一定でない認識対象文字列に対する認識性能が良くないという従来手法の問題点を改善する手法を提案する.この手法では,部分領域を区切る際に,個々の文字の大きさをより正確に反映させる.次に認識実験を行い,従来手法の認識結果と比較することで改善手法の有効性を示す.