著者
山本 純子 大澤 留次郎
出版者
国立研究開発法人 科学技術振興機構
雑誌
情報管理 (ISSN:00217298)
巻号頁・発行日
vol.58, no.11, pp.819-827, 2016-02-01 (Released:2016-02-01)

現代に生きるほとんどの日本人は「くずし字」で書かれた古典籍を読めず,大量に現存する古典籍の内容がわからなくなりつつある。そこで,負荷の高い翻刻の省力化を目的に,新方式OCRを開発した。くずし字を含む古典籍を対象とした原理検証実験の結果,一定の条件下で,精度80%以上の自動テキストデータ化が可能であることを実証した。新方式OCRでは,文字画像を位置情報とともに切り出した字形データベースを構築。この字形データベースから類似字形検索により翻刻対象古典籍の文字の文字コードを特定する。また,完全自動化ではなく,人手と自動処理を組み合わせた作業工程設計により翻刻の総合的な負荷軽減を目指す。新方式OCRの仕組みと,これを用いた翻刻の現況を報告する。

言及状況

外部データベース (DOI)

はてなブックマーク (1 users, 1 posts)

Twitter (37 users, 40 posts, 40 favorites)

↑の論文 古典籍翻刻の省力化:くずし字を含む新方式OCR技術の開発 https://t.co/2yiwwCwiv5
“古典籍翻刻の省力化:くずし字を含む新方式OCR技術の開発” https://t.co/keVHTmvYqv #JLA短信 #文字
古典籍翻刻の省力化:くずし字を含む新方式OCR技術の開発 (J-STAGE) https://t.co/oF98e9Zfj1 以前話題になった技術について詳しく解説されている。大変興味深い。 https://t.co/JytNWbko2G
リツイート数(%)の推移(72時間): 凸版印刷さんのくずし字OCR「精度80%以上」 https://t.co/Z85aDb8Avq 、… https://t.co/dUnk93L2pD #凸版印刷 #印刷業界
凸版印刷さんのくずし字OCR「精度80%以上」 https://t.co/ZraQxfpkH2 、 改めてよく見ると、図10で「30位まで-切り捨て0」の読み取り正答率が約80%とある。これは候補の上位30位までの累積認識率なのだろうか(1位認識率はどの程度?)「切り捨て」とは?
この崩し字OCRについての論文読んだら崩し字を一字一字崩し字の素養がある人が範囲を選択して判定させるみたいなんだけど、崩し字の素養があっても文字毎に選択して機械に読ませるほうが自分で読むより時間がかかるのかな。 https://t.co/o6mzbHrg03
古典籍翻刻の省力化:くずし字を含む新方式OCR技術の開発 https://t.co/zFZ2kqrQbL
山本純子・大澤留次郎.(2015). 「古典籍翻刻の省力化:くずし字を含む新方式OCR技術の開発」『情報管理』58(11), 819-827. https://t.co/vmylS83yaZ
学術論文ではないからと言えばそうなんだけど結果的に同種の取組みの先行事例になっていて実績も豊富なSmart-GSにも言及してもらいたかったなと。 RT @db_jst 「情報管理」古典籍翻刻の省力化:…。凸版印刷株式会社の https://t.co/goQxLuKfz9
「情報管理」2016年2月号 古典籍翻刻の省力化:くずし字を含む新方式OCR技術の開発 原理検証実験の結果、くずし字を含む古典籍が精度80%以上で自動テキストデータ化できました。凸版印刷株式会社の山本純子氏と大澤留次郎氏が報告します https://t.co/ZCxyg0I7QK
古典籍翻刻の省力化:くずし字を含む新方式OCR技術の開発 https://t.co/RTZvo4DIVo

収集済み URL リスト

https://www.jstage.jst.go.jp/article/johokanri/58/11/58_819/_article/-char/ja/ (28)

https://www.jstage.jst.go.jp/article/johokanri/58/11/58_819/_html/-char/ja/ (11)

https://www.jstage.jst.go.jp/article/johokanri/58/11/58_819/_pdf (1)