著者
馬場 基 中川 正樹 久留島 典子 高田 智和 耒代 誠仁 山本 和明 山田 太造 笹原 宏之 大山 航 中村 覚 渡辺 晃宏 桑田 訓也 山本 祥隆 高田 祐一 星野 安治 上椙 英之 畑野 吉則
出版者
独立行政法人国立文化財機構奈良文化財研究所
雑誌
基盤研究(S)
巻号頁・発行日
2018-06-11

国際的な歴史的文字の連携検索実現のため、「IIIFに基づく歴史的文字研究資源情報と公開の指針」および「オープンデータに関する仕様」(第一版)を、連携各機関(奈良文化財研究所・東京大学史料編纂所・国文学研究資料館・国立国語研究所・京都大学人文学研究所・台湾中央研究院歴史語言研究所)と共同で策定・公表し、機関間連携体制の中核を形成した。また、上記「指針」「仕様」に基づく、機関連携検索ポータルサイト「史的文字データベース連携システム」の実証試験版(奈文研・編纂所・国文研連携)を令和2年3月に公開。令和2年10月には、台湾中研院・国文研・京大人文研のデータを加えて、多言語(英語・繁体中国語・簡体中国語・韓国語)にて本公開を開始した(https://mojiportal.nabunken.go.jp/)。なお、連携・サイト公開は、国内および台湾メディアで報道された。木簡情報の研究資源化として、既存の木簡文字画像(約10万文字)をIIIF形式に変換した。また、IIIF用の文字画像切出ツールを開発し、新規に約15,000文字(延べ)のデータを作成した。過年度と合わせて合計約115,000文字の研究資源化を実現した。文字に関する知識の集積作業として、木簡文字観察記録シートを約50,000文字(延べ)作成した。なお、同シートによる分析が、中国簡牘・韓国木簡にも有効であることが確認されたことを踏まえ、東アジア各地の簡牘・木簡文字の観察作業も実施した。国際共同研究・学際研究として、令和1年9月に、東アジア木簡に関する国際学会を共催した(北京)。当初、国際学会の開催は、研究計画後半での実施を予定していたが、本研究遂行にあたっての共同研究等の中で、学会共催の呼びかけを受け、予定を繰り上げて国際学会を共催した。また、人文情報学の国内シンポジウム等において、IIIF連携等本研究の成果を報告した。
著者
松田 圭悟 大山 航 若林 哲史
出版者
The Institute of Electronics, Information and Communication Engineers
雑誌
電子情報通信学会論文誌 A (ISSN:09135707)
巻号頁・発行日
vol.J100-A, no.12, pp.435-443, 2017-12-01

本研究では,訓練偽筆を含まない学習データを用いた組み合わせ分割署名照合法を提案する.提案手法は,まず,ペン先のx, y座標,筆速,筆圧の時系列で構成されるオンライン署名情報を入力し,筆速,筆圧をそれぞれストローク幅,濃度値に反映させた署名画像を生成する.次に,オンライン署名時系列及び生成された署名画像のそれぞれをストロークの重心位置で分割する.入力されたオンライン署名時系列及び生成された署名画像とそれぞれの分割署名をオンライン用,オフライン用の手法で照合し,照合スコアを判定用SVMで真偽判定する.判定用SVMの学習には真筆同士,真筆と偽筆の照合スコアを含む学習用データを用いる必要があるが,本論文では偽筆クラスの学習サンプルとして第三者の真筆を用いるランダム偽筆学習を提案する.また,偽筆サンプルの削減のために,One-class SVMとk-meansクラスタリングを用いた効果的なサンプリング手法も提案する.多言語署名を含むSigCompデータセットを用いた評価実験の結果,訓練偽筆を含む学習用データセットを用いて学習した場合と同程度の精度の署名照合が実現できた.
著者
岩田 聖也 大山 航 若林 哲史 木村 文隆
出版者
一般社団法人 電気学会
雑誌
電気学会論文誌C(電子・情報・システム部門誌) (ISSN:03854221)
巻号頁・発行日
vol.136, no.12, pp.1668-1676, 2016-12-01 (Released:2016-12-01)
参考文献数
18

The authors have conducted studies on Arabic telop recognition to develop a system for video retrieval by keyword to index and edit Arabic broadcast programs received daily and stored in a big database. This paper describes a dedicated OCR for recognizing low resolution telop in video images. A telop recognition system consisting of text line extraction, word segmentation and segmentation-recognition of words is developed and the performance was experimentally evaluated using datasets of frame images extracted from AlJazeera broadcasting programs. Character recognition of moving telop is difficult due to combing noise caused by the interlacing of scan-lines. A technique to detect and eliminate the combing noise to correctly recognize the moving telop is proposed. This paper also proposes a technique based on insertion operation with minimum edit distance between successive two telops to connect them. The method to connect the moving telops is necessary for automatic language translation. The proposed method using edit distance for bi-gram sequence of telops (Method-B) is shown to be robust to recognition error of characters and successfully connect the telops.
著者
尾木 雄貴 大山 航 若林 哲史 木村 文隆
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. CNR, クラウドネットワークロボット
巻号頁・発行日
vol.113, no.432, pp.95-96, 2014-02-06

本人確認は,個人情報の保護や不正アクセス防止に重要な問題である.そのため,安全性の高いバイオメトリクスへの期待が高まっている.その中でも署名照合はデータ取得に対する社会的受容性が高いため,数多くの研究が行われている.しかし,それらの多くは単一言語に特化している.本研究では,複数の異なる言語の署名に対して同じ手順を適用し異なる言語の署名に対しても性能が安定した署名照合の手法を提案する.提案手法では,1つのオンライン署名データから2パターンの画像を生成する.各画像から濃度こう配特徴を抽出し,それぞれのマハラノビス距離を求める.得られた2つのマハラノビス距離を新たに2次元特徴ベクトルとし,これをあらかじめ真筆,偽筆の2クラス分類を行うように学習させたSVMで識別する.この手法により,中国語8.87%,オランダ語8.90%の等価エラー率が得られた.
著者
上平 裕太 大山 航 若林 哲史 木村 文隆
出版者
一般社団法人 電気学会
雑誌
電気学会論文誌C(電子・情報・システム部門誌) (ISSN:03854221)
巻号頁・発行日
vol.134, no.12, pp.1809-1816, 2014 (Released:2014-12-01)
参考文献数
15

This paper proposes a signature verification technique called combined segmentation-verification based on off-line features and on-line features. We use three different off-line feature vectors extracted from full name Japanese signature image and from the sub-images of the first name and the last name. The Mahalanobis distance for each off-line feature vector is calculated for signature verification. The on-line feature based technique employs dynamic programming (DP) matching technique for time series data of the fullname signature and first name and last name. The final decision (verification) is performed by SVM (Support Vector Machine) based on the three Mahalanobis distances and three dissimilarity of the DP matching. In the evaluation test the proposed technique achieved 3.35% EER (Equal Error Rate) with even FRR (False Acceptance Rate) and FAR (False Rejection Rate), which is 3.10% lower than the best EER obtained by the individual technique. This result shows that the proposed combined segmentation-verification approach improves Japanese signature verification accuracy significantly.
著者
蔵元 侃太 大山 航 若林 哲史 木村 文隆
出版者
一般社団法人 電気学会
雑誌
電気学会論文誌C(電子・情報・システム部門誌) (ISSN:03854221)
巻号頁・発行日
vol.134, no.12, pp.1817-1823, 2014 (Released:2014-12-01)
参考文献数
23

Recently, expectations for camera-based document analysis and recognition have increased by improved performance of digital camera devices. In this paper, we propose a rotation angle estimation method using Gray-Scale Gradient Feature and Modified Quadratic Discriminant Function (MQDF). This method can recognize characters and estimate the rotation angle of those characters rapidly. As the result of the evaluation experiment using printed alphanumeric character, we have confirmed that the low dimensional feature vector is sufficient to estimate the rotation angle of characters. Also, we reduced the number of used eigenvectors of the covariance matrix to calculate the MQDF while keeping estimation accuracy.
著者
大山 航 山本 暁仁 若林 哲史 木村 文隆
出版者
一般社団法人 電気学会
雑誌
電気学会論文誌C(電子・情報・システム部門誌) (ISSN:03854221)
巻号頁・発行日
vol.134, no.12, pp.1824-1831, 2014 (Released:2014-12-01)
参考文献数
16

Accurate off-line character recognition is still very important for camera based printed document analysis. Due to its inherent conceptual and technical simplicity, conventional recognition strategies relied on features extracted using square block zoning of a character image. In this paper, we propose an isotropic feature extraction method using regular hexagonal zoning and empirically confirm its effectiveness for printed and handwritten character recognition. We accomplished printed character recognition and handwritten character recognition experiments using large-scale evaluating datasets. The average accuracy was improved by 2 % in experiments using gradient features. And the effectiveness of hexagonal zoning for recognition of high stroke count characters and low-resolution characters is confirmed in both printed and handwritten character recognition by the experiments.
著者
小池 秀明 大山 航 若林 哲史 木村 文隆
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 (ISSN:09135685)
巻号頁・発行日
vol.107, no.57, pp.7-10, 2007-05-17
参考文献数
7

本研究ではアダルト画像検出法を提案する。本手法では、対象とするアダルト画像に肌領域が多く含まれ、これら肌領域は色の均質性・集塊性を持つことを前提とする。まず、GMM(Gaussian Mixture Model)を用いて肌尤度画像を作成する。次に、肌尤度画像中で、色の均質性を有する領域のみを検出する。検出された領域ごとに閥値を動的に生成し、その閥値を用いて色の均質性・集塊性を考慮した肌領域の拡張処理を行い、最終的な肌領域とする。そして、求められた肌領域の肌尤度画像をリサイズして得られた値に主成分分析、独立成分分析を適用し、SVMで学習・分類を行い、アダルト画像を検出する。