- 著者
-
田中 勝
村川 猛彦
宇都宮 啓吾
- 雑誌
- 情報処理学会論文誌 (ISSN:18827764)
- 巻号頁・発行日
- vol.59, no.2, pp.288-298, 2018-02-15
現在,古写経を中心とした文書の電子化が進められている.しかしながら漢文に送り仮名やヲコト点が付与された,訓点資料においては,文書の翻刻(テキスト化)やそれを管理するシステムの提供が十分ではなかった.本研究では,訓点資料における解読支援環境の確立を目指し,訓点資料を対象とした翻刻支援システムの構築を行ってきた.システム構築にあたり,訓点資料が手書き文書であることや,訓点資料に含まれる多様な記述情報に対応することを考慮して,訓点資料の記述情報を文字領域や点座標としてデータベースに格納し,情報間の関連付けを行うことで解決を図った.また,HTML5 Canvasを用いた画像ベースのインタフェースにより,直感的な操作で資料画像上に入力する仕組みを実現し,行・列番号や読みの自動推定機能をサーバ側で実装することで,ユーザによる入力の手間を省く試みを行った.評価実験により,システムの操作性に問題がないこと,1件ごとの平均入力時間は約3秒で十分に実用的であること,および自動取得したデータの誤り数は少なく手動修正が可能な範囲であることを確認した.Recently ancient sutras have been computerized. However the support for written materials with reading marks such as "okototen" is not sufficient with regard to the transcription of documents and the system for dealing with the contents. This paper aims to establish a transcription support environment for written materials with reading marks. Taking into consideration the fact that the target documents were handwritten and hold a variety of descriptive information, we developed the system so that the descriptive information of reading marks can be stored as coordinates of a rectangular area or a point in the database and the data can be mutually related. Furthermore we attempt to ease the burden of input, by developing an image-based interface using HTML5 Canvas for specifing Chinese characters and reading marks on the document image intuitively, and by implementing automatic acquisition features for character position and reading of marks. Evaluation experiments made sure that there was no problem found in the operation of the system, the average input time was around three seconds, which means the practicability of this system, and the mistakes made in the automatic acquisition were so few that we could correct them manually.