著者
吉賀 夏子 堀 良彰 只木 進一 永崎 研宣 伊藤 昭弘
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.63, no.2, pp.310-323, 2022-02-15

わが国には,江戸時代以前に記された業務記録や証文などの古記録が数多く存在する.これらを有効に活用するためには,少ない工数で機械可読データを構築する必要がある.特に,地域特有の資料の場合には,地域特有の固有表現への対応が必要となる.本研究では,江戸期の業務日誌である「小城藩日記データベース」の目録記事文からLinked Dataなどの機械可読データを生成することを具体的目標とし,固有表現抽出の効率化を行う.その第1の手法は,市民参加による人手そのものの有効活用である.第2の手法は,機械学習による固有表現の自動抽出である.これらの手法を組み合わせることで,通常は収集の難しい地域特有の固有表現を記事文から,自動かつ高精度で抽出可能である.
著者
吉賀 夏子 只木 進一
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.59, no.2, pp.257-266, 2018-02-15

Web上には,江戸時代以前の書籍である古典籍の書誌および画像データが多数公開されている.これらのデータの活用には,古典籍を構成する序や跋などの情報を含めて,Linked Data形式などへ構造化することが有効である.古典籍の書誌データは専門用語が多く,構造化のためには,一般には専門家の手作業が必要であった.本稿では,形態素解析と注記の記述様式に特化したスクリプトを活用することで,半自動でこうした作業を実施する方法を提案する.また,具体的なコレクションへの適用を通じて,手法の有効性を検証する.提案手法は,コレクションごとに軽微な調整で適用できる手法であり,古典籍の書誌データを構造化するために有効である.
著者
吉賀 夏子
出版者
一般社団法人 情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.73, no.11, pp.500-506, 2023-11-01 (Released:2023-11-01)

人文科学分野におけるシチズン・サイエンスの実践例として,地域の歴史資料を翻刻して得たテキストデータを用いて固有表現抽出を行い,そのデータおよび記載内容を様々な人が利活用するきっかけを提供する「小城藩日記プロジェクト」の概要を述べる。本プロジェクトでは,自治体運営の古文書教室を通じて集まった参加者が地域特有の人名や地名などの固有表現収集に大きな役割を果たした。その際に生じた作業モチベーションの維持やデータの質の管理などの課題の解決について述べる。また,当プロジェクトで獲得した知見を基に新たに構築中のAI自動翻刻に必要な学習データ収集プロジェクトについても紹介する。
著者
吉賀 夏子 堀 良彰 牛島 清豪
出版者
電気・情報関係学会九州支部連合大会委員会
雑誌
電気関係学会九州支部連合大会講演論文集 2019年度電気・情報関係学会九州支部連合大会(第72回連合大会)講演論文集
巻号頁・発行日
pp.591-592, 2019-09-19 (Released:2020-01-20)

大雨時の防災において、地域の河川水位情報の変化を速やかに取得するため、河川水位時系列情報と河川水位観測所の情報を Linked Data として統合し蓄積および配信を行う情報システムを設計したので報告する。
著者
吉賀 夏子 渡辺 健次 只木 進一
出版者
一般社団法人 人工知能学会
雑誌
JSAI大会論文集
巻号頁・発行日
vol.2013, pp.1N3OS10a4i, 2018-07-30

<p>Web上で参照可能な歴史的価値の高い貴重書等の書誌データは、年々充実している。書誌データの活用を促進するために、対応するオントロジーを提案し、Semantic Web技術を基にした検索システムを構築した。応用として、佐賀大学の貴重書および国立国会図書館の書誌データから引用可能な著作を例に、国立国会図書館の典拠データを利用して名寄せを行い、各データベースの書誌を同じタイムライン上に可視化した。</p>
著者
吉賀 夏子 只木 進一
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.59, no.2, pp.257-266, 2018-02-15

Web上には,江戸時代以前の書籍である古典籍の書誌および画像データが多数公開されている.これらのデータの活用には,古典籍を構成する序や跋などの情報を含めて,Linked Data形式などへ構造化することが有効である.古典籍の書誌データは専門用語が多く,構造化のためには,一般には専門家の手作業が必要であった.本稿では,形態素解析と注記の記述様式に特化したスクリプトを活用することで,半自動でこうした作業を実施する方法を提案する.また,具体的なコレクションへの適用を通じて,手法の有効性を検証する.提案手法は,コレクションごとに軽微な調整で適用できる手法であり,古典籍の書誌データを構造化するために有効である.A large amount of bibliographic data and images of Japanese historical rare books, published during the Edo period and before, have been accessible recently on the Web. For utilization of those data, it is effective to convert information including book parts such as preface and epilogue into well-formed data format like Linked Data. Such conversion, in general, has required handworks by persons with special knowledge. This paper proposes a new semi-automatic method for this task, where the method employs morphological analysis tools and scripts specialized to formats in bibliographic notes. The method is evaluated by applying it to some collections. The method can be applied to a collection with small amount of tunings, and is effective to formalize bibliographic data of Japanese historical rare books.