著者
竹内 正広 早坂 太一 大野 亙 加藤 弓枝 山本 和明 石間 衛 石川 徹也
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会全国大会論文集 第33回全国大会(2019)
巻号頁・発行日
pp.3Rin209, 2019 (Released:2019-06-01)

国文学研究資料館により整備されている歴史的典籍データベースを有効活用することは,人文科学のみならず,自然科学系分野を融合させた研究の展開にもつながる.しかしながら多くの研究者にとっては,それらに書かれている文字が「くずし字」であることが障壁となる.本研究では,ディープラーニングによるくずし字認識モデルを応用し,小型で比較的安価なシングルボードコンピュータRaspberry Piを用いて,カメラで撮影した見開きの古典籍画像から,自動で1文字ずつのくずし字領域を検出し,それらの認識を可能とする組み込みシステムを開発した.既にWWWアプリケーションとして実装されている先行研究と比較して,認識するのにかかる時間や精度はほぼ変わらず,高性能なコンピュータを用いなくても,Raspberry Piのようなシングルボードコンピュータで問題なく動作することを示すことができた.これを発展させることで,研究者のみならず,スマートフォンを持ち込むことができない小・中学校や,普段モバイル機器を持ち歩かない高齢者の方々でも,くずし字に触れたいときにそれを支援するシステムを実現することができると考えられる.
著者
早坂 太一 大野 亙 加藤 弓枝 山本 和明
雑誌
じんもんこん2016論文集
巻号頁・発行日
vol.2016, pp.7-12, 2016-12-02

国文学研究資料館古典籍共同研究事業センターにより構築が進められている「日本語の歴史的典籍データベース」は,これを有効活用することで,異分野を融合させた研究の展開も期待されるが,いかに資料が集積されたとしても,多くの研究者にとっては,書かれている文字が「くずし字」であることが障壁となる.本研究は,世界的に注目されている人工知能技術である,ディープラーニングを用いたくずし字の自動翻刻システムの構築を目的とする.オープンデータとして公開されているいくつかの歴史的典籍内の変体仮名に対して,人工知能による認識の精度を算出するとともに,学習したモデルをWWWアプリケーションとして実装した.