著者
吉賀 夏子 堀 良彰 只木 進一 永崎 研宣 伊藤 昭弘
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.63, no.2, pp.310-323, 2022-02-15

わが国には,江戸時代以前に記された業務記録や証文などの古記録が数多く存在する.これらを有効に活用するためには,少ない工数で機械可読データを構築する必要がある.特に,地域特有の資料の場合には,地域特有の固有表現への対応が必要となる.本研究では,江戸期の業務日誌である「小城藩日記データベース」の目録記事文からLinked Dataなどの機械可読データを生成することを具体的目標とし,固有表現抽出の効率化を行う.その第1の手法は,市民参加による人手そのものの有効活用である.第2の手法は,機械学習による固有表現の自動抽出である.これらの手法を組み合わせることで,通常は収集の難しい地域特有の固有表現を記事文から,自動かつ高精度で抽出可能である.