- 著者
-
池田 光雪
- 出版者
- 千葉大学
- 雑誌
- 若手研究(B)
- 巻号頁・発行日
- 2017-04-01
本研究は,画像化されている日本語資料に対するマイクロタスク型クラウドソーシングを用いた効率の良い文字起こし,いわゆるデジタル翻刻手法の設計及びシステムの構築を行うことにより,デジタルアーカイブの更なる利便化等に資することを目的としている.複数の形式や粒度のタスクを組み合わせることや,光学的文字認識の精度により一度に校正する文字数を動的に変化させることなどにより,少ないタスク数でより多くの翻刻を高品質に行うことを目指す.平成29年度の実施内容は次の通りである.(1)デジタル翻刻を複数の段階に分割する設計の検討:既存のデジタルコレクションに対し実際に行われた光学的文字認識の結果を検討した.それにより,まず図画部分のような偽陽性の要因となる部分を除去し,その後文字認識の結果を校正するという二段階にデジタル翻刻を分ける検討を行った.(2)マイクロタスクの粒度に応じたタスク設計:文字認識の校正において,選択式や入力式のタスクを組み合わせることにより少ないタスク数で多くの文字の校正が行えるようなタスクの設計を行った.また,スマートフォンやパソコンといった環境の異なる媒体へのタスクの配信を想定し,媒体それぞれに対するタスクの最適化の検討を行った.(3)試験的なデジタル翻刻システムの実装:(1)(2)の結果を踏まえたマイクロタスク型クラウドソーシングによるデジタル翻刻システムの実装を部分的に行った.