著者
李 康穎 Batjargal Biligsaikhan 前田 亮
雑誌
じんもんこん2017論文集
巻号頁・発行日
vol.2017, pp.125-130, 2017-12-02

篆文は今でも広く使用されている古代の書体である.しかしその字形は抽象性が高いため,専門的な知識を持たない人にとって篆文字形を読むのは非常に難しい.また,現存の篆文の記載に使用する文献資源が極めて少ない状況であり,利用できる篆文の画像データも不足しているため,篆文に基づくOCR システムもほとんど存在しない.本研究は小篆の篆文書体を研究対象とし,白川静の漢字研究の成果に基づく「白川フォント」中の小篆書体の文字と「説文解字フォント」中の白川フォントと対応する文字をGenerative Adversarial Network に基づくzi2zi モデルの入力データとして利用し,生成された画像の変形処理を行う.処理した後の画像ファイルを訓練データとして使用し,文字認識の実験を行った.本論文では,生成した画像を手書き篆文の認識モデルの訓練データとして用いる手法を提案し,今後の手書き篆文文字の検索支援の実現に向けた基礎を構築することを目指す.
著者
SONG Yuting BATJARGAL Biligsaikhan 前田 亮
出版者
横断型基幹科学技術研究団体連合(横幹連合)
雑誌
横幹連合コンファレンス予稿集
巻号頁・発行日
vol.2017, pp.E-4-5, 2017

In recent years, as the Web technologies have matured in more and more countries, many culturalmemory institutions, such as libraries, museums and cultural heritage organizations, all around the world beginto digitize their collections and provide them on the Internet with metadata in different languages. With the emergenceof multilingual digitized collections, it opens up new opportunities but at the same time poses languagebarriers for accessing these large quantities of digitized collections. In this paper, we propose a method to findthe identical Ukiyo-e prints between databases in different languages by exploiting semantic similarity ofmetadata across languages, in order to achieve our ultimate research goal that aims to provide multilingual accessto multiple and diverse databases. We believe our proposed method could assist users in accessing Ukiyo-e databasesregardless of languages.