- 著者
-
渡辺 晃宏
馬場 基
市 大樹
山田 奨治
中川 正樹
柴山 守
山本 崇
鈴木 卓治
- 出版者
- 独立行政法人文化財研究所奈良文化財研究所
- 雑誌
- 基盤研究(S)
- 巻号頁・発行日
- 2003
奈良文化財研究所では、1961年に平城宮跡で初めて木簡を発掘調査して以来、20万点を超える木簡を調査・研究してきた。今回の研究では、この蓄積と、文字認識や情報処理に関する最新の情報学・情報工学との連携を図り、(1)木簡の情報を簡易にデジタル化するシステムの開発、(2)木簡の文字画像データベースの作成、(3)木簡解読支援データベース群の構築、(4)木簡の文字自動認識システム(OCR)の開発の4点を軸に研究を進め、木簡の文字画像データベース「木簡字典」と、木簡の文字解読支援システム「Mokkan Shop」(モッカンショップ)を開発した。「木簡字典」には、カラー・モノクロ・赤外線写真・記帳ノート(木簡の読み取り記録)の4種類の画像を掲載しており、これまでに約1,200字種、約20,000文字を収録した。「Mokkan Shop」には、今回開発した墨の部分を抽出するための画像処理手法や欠損文字に有効な文字認識システム、及び今回入力した古代の地名・人名・物品名のデータベースに基づく文脈処理モジュールを搭載し、解読の有効性を高めることができた。これにより、全体が残るとは限らない、また劣化の著しい、いわば不完全な状態にあるのを特徴とする木簡を対象とする、画期的な文字の自動認識システムの実用化に成功した。「木簡字典」と「Mokkan Shop」は、木簡など出土文字資料の総合的研究拠点構築のための有力なツールであり、当該史料の研究だけでなく、歴史学・史料学の研究を大きく前進させることが期待される。なお、今回の研究成果の公開を含めて木簡に関する情報を広く共有するために総合情報サイト「木簡ひろば」を奈良文化財研究所のホームページ上に開設した。また、WEB公開する木簡字典とは別に、『平城宮木簡』所収木簡を対象とした印刷版「木簡字典」として、『日本古代木簡字典』を刊行した。