著者
馬場 基 中川 正樹 久留島 典子 高田 智和 耒代 誠仁 山本 和明 山田 太造 笹原 宏之 大山 航 中村 覚 渡辺 晃宏 桑田 訓也 山本 祥隆 高田 祐一 星野 安治 上椙 英之 畑野 吉則
出版者
独立行政法人国立文化財機構奈良文化財研究所
雑誌
基盤研究(S)
巻号頁・発行日
2018-06-11

国際的な歴史的文字の連携検索実現のため、「IIIFに基づく歴史的文字研究資源情報と公開の指針」および「オープンデータに関する仕様」(第一版)を、連携各機関(奈良文化財研究所・東京大学史料編纂所・国文学研究資料館・国立国語研究所・京都大学人文学研究所・台湾中央研究院歴史語言研究所)と共同で策定・公表し、機関間連携体制の中核を形成した。また、上記「指針」「仕様」に基づく、機関連携検索ポータルサイト「史的文字データベース連携システム」の実証試験版(奈文研・編纂所・国文研連携)を令和2年3月に公開。令和2年10月には、台湾中研院・国文研・京大人文研のデータを加えて、多言語(英語・繁体中国語・簡体中国語・韓国語)にて本公開を開始した(https://mojiportal.nabunken.go.jp/)。なお、連携・サイト公開は、国内および台湾メディアで報道された。木簡情報の研究資源化として、既存の木簡文字画像(約10万文字)をIIIF形式に変換した。また、IIIF用の文字画像切出ツールを開発し、新規に約15,000文字(延べ)のデータを作成した。過年度と合わせて合計約115,000文字の研究資源化を実現した。文字に関する知識の集積作業として、木簡文字観察記録シートを約50,000文字(延べ)作成した。なお、同シートによる分析が、中国簡牘・韓国木簡にも有効であることが確認されたことを踏まえ、東アジア各地の簡牘・木簡文字の観察作業も実施した。国際共同研究・学際研究として、令和1年9月に、東アジア木簡に関する国際学会を共催した(北京)。当初、国際学会の開催は、研究計画後半での実施を予定していたが、本研究遂行にあたっての共同研究等の中で、学会共催の呼びかけを受け、予定を繰り上げて国際学会を共催した。また、人文情報学の国内シンポジウム等において、IIIF連携等本研究の成果を報告した。
著者
耒代 誠仁
出版者
桜美林大学
雑誌
若手研究(B)
巻号頁・発行日
2010

古代木簡デジタルアーカイブをターゲットとした知的情報検索の実現に向けた研究を行った。パターン認識技術、画像処理技術、ペン・ユーザインタフェース技術を用いた破損字形検索技術を実現することで、解読が困難となった字形の類例検索を実現した。また、検索技術を含む古代木簡解読支援システム「Mokkanshop」の開発と一般公開を行った。このソフトウェアは古代木簡デジタルアーカイブ「木簡字典」と連動し、利用者に実用的な情報検索を提供する。
著者
耒代 誠仁 中川 正樹 馬場 基 渡辺 晃宏
雑誌
じんもんこん2011論文集
巻号頁・発行日
vol.2011, no.8, pp.93-98, 2011-12-03

本稿では古代木簡解読を支援する画像処理および字体検索の高度化に関する我々の研究について述べる.画像処理の改善は,汚損・破損した古代木簡の可読性を高め,高精度な字体抽出を実現するために重要である.我々はカラーチャネルおよび周波数に関する分析結果を踏まえ,木目,腐食に有効な画像処理を実現した.また,木簡解読支援システムのユーザインタフェースを改良し,画像処理の実施に必要な操作を簡素化した.字体検索については,テンプレートを増やすと共に形状特徴抽出の改善を行い,検索精度の改善を実現した.
著者
耒代 誠仁 高田 祐一 井上 幸 方 国花 馬場 基 渡辺 晃宏 井上 聡
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.59, no.2, pp.351-359, 2018-02-15

古文書の研究者にとって,古文書デジタルアーカイブの活用を促すことは重要な課題である.本論文では,字形画像をキーとした横断検索技術による古文書Webデジタルアーカイブ活用への効果について述べる.字種は文書に対する現実的な検索キーの1つである.しかし,古文書において字形との対応は必ずしも確定しない.この課題を解決するために,私たちは字形画像をキーとした古文書Webデジタルアーカイブの横断検索を実装した.5カ月間の実験で入力されたキー数は合計で200,000件を超えた.これは字種による横断検索の件数と比較しても十分に大きい.また,私たちは古文書解読の専門家による評価実験を実施した.専門家は,使いなれた画像処理ソフトウェアを搭載したPCもしくは筆者らが作成した画像処理ソフトウェアを搭載したiPod Touch,またはその両方を使用した.「検索結果にキーと類似した画像が含まれるか」という旨の質問に対しては,すべての専門家が肯定的な回答を示した.検索精度と使い勝手の向上,および字形テンプレートの整備を通した活用のさらなる促進は今後の課題である.
著者
戸根 康隆 相澤 優秀 西川 悟 耒代 誠仁
出版者
日本法科学技術学会
雑誌
日本法科学技術学会誌 (ISSN:18801323)
巻号頁・発行日
vol.22, no.2, pp.145-151, 2017 (Released:2017-07-27)
参考文献数
11
被引用文献数
1

In criminal investigations, writer-identification to discriminate writers of documents used in crimes has important roles. In the identification processes, writer-unknown documents are compared with writer-known documents. Experts of the process give careful considerations for the comparisons by referring to handwriting-samples, experimental-data, and other vast knowledge collected from past investigations. Characteristics of handwritten strokes written on the documents are highly useful for the experts. Therefore, accurate and efficient managements of the characteristics are important. However, in the daily investigations, the characteristics have been recorded in a huge amount of paper media without indexes, and the amount is growing. In this paper, we propose two prototypes of database system to store and retrieve the characteristics. The database system consists of (1) common digital formats to indicate the characteristics, (2) aggregation functions of the digital indicators for the retrieval, and (3) user interface for the experts. The first prototype is implemented with VBA of Microsoft Excel. We present our experimental results by using 228 testing data sets. The second practical prototype is implemented with XML and Java. We expect that our database system will improve the efficiency and the accuracy of the writer-identification processes, and accelerate information sharing among the experts beyond time and space.
著者
戸根 康隆 相澤 優秀 西川 悟 耒代 誠仁
出版者
日本法科学技術学会
雑誌
日本法科学技術学会誌 (ISSN:18801323)
巻号頁・発行日
vol.22, no.2, pp.145-151, 2017
被引用文献数
1

&emsp;In criminal investigations, writer-identification to discriminate writers of documents used in crimes has important roles. In the identification processes, writer-unknown documents are compared with writer-known documents. Experts of the process give careful considerations for the comparisons by referring to handwriting-samples, experimental-data, and other vast knowledge collected from past investigations. Characteristics of handwritten strokes written on the documents are highly useful for the experts. Therefore, accurate and efficient managements of the characteristics are important. However, in the daily investigations, the characteristics have been recorded in a huge amount of paper media without indexes, and the amount is growing. In this paper, we propose two prototypes of database system to store and retrieve the characteristics. The database system consists of (1) common digital formats to indicate the characteristics, (2) aggregation functions of the digital indicators for the retrieval, and (3) user interface for the experts. The first prototype is implemented with VBA of Microsoft Excel. We present our experimental results by using 228 testing data sets. The second practical prototype is implemented with XML and Java. We expect that our database system will improve the efficiency and the accuracy of the writer-identification processes, and accelerate information sharing among the experts beyond time and space.<br>
著者
白井 啓一郎 耒代 誠仁 井上 聡 久留島 典子 馬場 基 渡辺 晃宏 中川 正樹
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2013, no.7, pp.1-6, 2013-01-18

汚損,破損,および経年変化が著しい古文書から抽出した字形には多くのノイズが見られる.このような字形にノイズ除去のための汎用の画像処理手法を適用した場合,字形の細部が失われることがある.筆者らは,異方性拡散と距離画像を組み合わせることで,字形の本質的な形状を保存するノイズ除去のための画像処理手法を実現した.本稿では,古文書に記された字形を含む画像にこの画像処理手法を適用した結果を示すと共に検証を行う.Character shapes extracted from historical documents with stains, damages and time-related degradations contain much noise. General-purpose image processing for noise reduction often shaves off the detail of the character shapes. We have implemented new image processing for noise reduction that consists of anisotropic diffusion and geodesic morphology. In this manuscript, we show several results of the image processing applied to character shape image of historical documents and make considerations of the results.
著者
持田 桂介 耒代 誠仁 朱 碧蘭 小沼 元輝 中川 正樹
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.104, no.741, pp.43-48, 2005-03-10

本稿では, 数式の混在を許容したオンライン手書き文字列認識手法を提案する.文字列認識や数式認識は, それぞれが認識対象とするパターンだけしか入力されないことを前提としている.しかし, 手書きパターン認識の分野では, これらが混在して入力される場合を想定しなければならない.本手法では, すべての数式を一つの文字として日本語文脈構造に取り入れることで, 従来の文字列認識手法に基づいた処理を可能とした.このとき, 元々文字列認識手法に基づいているため, 数式が混在しない文字列に対しても問題なく処理可能である.また, 一文字でも文字列として扱うという考えを拡張し, 数式だけの入力に対しても「数式」という一文字で構成される文字列として扱うことが可能である.
著者
山家 浩樹 林 譲 久留島 典子 鴨川 達夫 高橋 則英 高田 智和 馬場 基 大内 英範 耒代 誠仁 高橋 敏子 遠藤 基郎 山田 太造 渡辺 晃宏 小倉 慈司 高橋 典幸 井上 聰 谷 昭佳 川本 慎自 高山 さやか
出版者
東京大学
雑誌
基盤研究(A)
巻号頁・発行日
2011-04-01

「ボーンデジタル進捗状況管理システム」を構築して、無秩序に生成されがちなデジタル撮影画像(ボーンデジタル)を、組織として一貫して管理・運用するシステムを確立し、歴史史料のデジタル画像を共有する基盤を整えた。さらに、標準化された仕様に適合しないデジタル画像を、メタデータとともに管理する一例として、ガラス乾板など古写真を取り上げ、「ガラス乾板情報管理ツール」を開発して、ガラス乾板の研究資源化および保存にむけた研究を行なった。あわせて、具体例をもとに、デジタル画像を主たるレコードとするデータベースの構造転換に向けた研究を推進した。