著者
カラーヌワット タリン
出版者
早稲田大学
巻号頁・発行日
pp.1-180, 2017

早大学位記番号:新7763
著者
北本 朝展 カラーヌワット タリン Alex Lamb Mikel Bober-Irizar
雑誌
じんもんこん2019論文集
巻号頁・発行日
vol.2019, pp.223-230, 2019-12-07

機械学習(ディープラーニング)を活用したくずし字OCRの研究が盛り上がりを見せている。こうした研究をさらに後押しするために、我々は世界最大の機械学習コンペプラットフォームであるKaggle上で、2019年7月から10月にかけて「くずし字認識」コンペを開催した。本論文はこのコンペの準備・経過・成果の各段階について、実際に行ったこととそこから得られた教訓をまとめるとともに、人文情報学の分野で機械学習コンペを活用することの価値を検討する。
著者
カラーヌワット タリン
出版者
早稲田大学
巻号頁・発行日
2018

終了ページ : 180
著者
カラーヌワット タリン 北本 朝展
雑誌
じんもんこん2020論文集
巻号頁・発行日
vol.2020, pp.3-10, 2020-12-05

人文学オープンデータ共同利用センター(CODH)と国文学研究資料館が2016年に日本古典籍くずし字データセットを公開した後,くずし字認識研究は大きく進展した.そして2019年のKaggleくずし字認識コンペティションを経て,CODHはKuroNetくずし字認識サービスを公開した.本論文はこうした流れを振り返り,くずし字認識と物体検出アルゴリズムの関係,KuroNetの進化,くずし字認識のサービス化,Kaggleコンペの教訓,くずし字認識スマホアプリの開発,くずし字認識研究の課題とデータセットの拡大など,くずし字研究の多岐にわたる展開をまとめる.