- 著者
-
鈴木 俊哉
鈴木 敦
菅谷 克行
- 雑誌
- 研究報告情報基礎とアクセス技術(IFAT)
- 巻号頁・発行日
- vol.2015-IFAT-118, no.5, pp.1-6, 2015-03-23
甲骨文字のデジタル化において,文字符号化して問題ないか,あるいは画像として扱うべきかは,拓本資料の鮮明さや掲出例数を考慮して判断しなければならない.我々は印刷物として公表されたデータベースである 『殷墟卜辭綜類』 と 『殷墟甲骨刻辭類纂』 に基づいた検討をすすめているが,全て手書き資料であり,また,そこに模写された文字の集合も明確ではないため,文字認識的な手法をとることができない.本研究では,掲出例数を概算するため,両書に共通するレイアウト構造をもとに模写テキストを画像分解する方法を検討した.両書の画像分解精度が大きく異なる結果が得られたが,この原因は両書の編集・出版方針の違いによると推測される.また,本研究の手法の適用範囲についても報告する.