著者
永崎 研宣 三宅 真紀 苫米地 等流 A.CharlesMuller 下田 正弘
雑誌
じんもんこん2013論文集
巻号頁・発行日
vol.2013, no.4, pp.239-246, 2013-12-05

本稿は、大正新脩大藏經テキストデータベースにおける脚注の校勘情報を通じた人文学資料としてのテクスト構造化に関する研究を扱う。これはこのデータベースを構築・運用するSAT プロジェクトの次のフェーズの方針の策定に役立てることを目指すものである。大正新脩大藏經の校勘情報は、各一次資料の歴史的な関係からある程度想定可能だが、具体的に研究されてきたわけではなかった。ここでは、デジタル化された校勘情報を用いた分析を行ったが、結果は一般的な想定を裏付けするものであった。いくつかの例外的なものがあったことが、今後の方針を策定する上で有益かもしれない。また、Linked Data という形で校勘情報を扱うことで、一次資料公開に関する権利所有者との合意形成が容易になるかもしれない。
著者
原 翔子 永崎 研宣 高木 聡一郎 大向 一輝
出版者
デジタルアーカイブ学会
雑誌
デジタルアーカイブ学会誌 (ISSN:24329762)
巻号頁・発行日
vol.7, no.4, pp.e45-e51, 2023 (Released:2023-11-01)
参考文献数
12

本稿では、同一テーマの下で企画された複数の展覧会の構成を共起ネットワークによって可視化し、その比較によって、キュレーションが鑑賞者に異なる視点を与えることを明らかにした。具体的には、河鍋暁斎をテーマとする3つの展覧会を対象とした。分析対象となった日本画や浮世絵は、描かれているモチーフが作品名に反映されているため、計量テキスト分析が可能である。実地での鑑賞を検討する際の情報収集や、鑑賞後に展覧会を振り返る際に、本稿の手法は有用である。また、全体像として共起図を提示しておくことで、さらに多角的な鑑賞視点が期待できる。本稿の成果はキュレーション機能を持つデジタルコレクションに対して大いに有用であると期待される。
著者
永崎 研宣 青池 亨 本間 淳
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:21888957)
巻号頁・発行日
vol.2022-CH-129, no.13, pp.1-3, 2022-05-14

現在のデジタルアーカイブの多くは,実物をデジタル撮影した画像を掲載している.そのなかでは,現物のサイズを確認できるように定規を画像に写し込んでいるものが多く見られる.これは目視でサイズを想定しながらデジタル化資料を閲覧する際にはきわめて有用である.一方,関連のある複数の画像を対比したり重ねて透過したりすることは,デジタルアーカイブに搭載されたコンテンツの利活用方法として有効であるものの,この場合には,この画像中の定規は,目視でサイズをあわせるべく画像を縮小拡大しながら調整する際の参考情報でしかなかった.そこで,筆者らは,二つの画像に写し込まれたそれぞれの定規を画像認識によって比較し,画像サイズを自動的に調整するモデルを考案し,それに沿った実装を開発した.本発表では,このモデルと実装について報告し,今後の課題を提示する.
著者
永崎 研宣
出版者
一般社団法人 情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.71, no.4, pp.165-170, 2021-04-01 (Released:2021-04-01)

デジタルアーカイブシステムにおける標準化技術には様々なものがある。技術に対応する規格も存在し,それぞれに標準化団体が活動を継続している。本稿では,Unicode,IIIF,TEIを採り上げてそれらの特徴を概観した。国際標準はただ従うのみでなく,自らの固有性が消されてしまうことがないような検証が必要であり,場合によっては国際標準の側を修正すべきこともある。デジタルアーカイブの取り組みの全体の中では,国際標準化活動にそのような観点から積極的に関与することも重要である。
著者
青田 寿美 永崎 研宣 白須 裕之 古勝 隆一
出版者
国文学研究資料館
雑誌
挑戦的研究(開拓)
巻号頁・発行日
2018-06-29

NIJL「蔵書印データベース」は、4万件を超えるレコード数量を有し、31項目からなるコンテンツを活用するための多様な検索機能を兼ね備え、国内外に類例をみない印影データベースとして高い評価と利用実績をあげてきた。本研究では、個別レコードの情報整備と新たな項目の追増等を行うことで印影検索機能の拡充を実現する他、篆書体学習者向けの「篆字部首・画像検索システム」を構築することにより、ユーザの高次利用に応え篆字読解力をも助長するデータベースの新展開を目指す。また、「篆字データセット」を公開することにより、次世代へ受け渡す知識ベースの開拓へと繋げる。
著者
明星聖子 永崎 研宣
雑誌
情報処理学会研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2007, no.49(2007-CH-074), pp.25-32, 2007-05-25

本稿は、人文科学研究資料のための汎用的なエディティング・システム構築をめぐる研究報告である。まず第一段階として、カフカの文学作品のなかでも編集という点でもっとも複雑な問題を呈している”Der Jaeger Gracchus”のテクストに関する情報を、ドイツ編集文献学の理論に基づき構造化し、それをインド仏教学研究用に開発された文献関連情報データベース上へ実装することを試みている。現在この試みは比較的順調に進行しており、その順調さの背景には、文学と宗教学の文献情報処理の方法の共通性が認められる。今回の研究は、システム開発を通してこうした共通性を検討しながら、汎用的システム設計を支える汎用的な文献学理論を模索することも目的としている。
著者
永崎 研宣
出版者
一般社団法人人文情報学研究所
巻号頁・発行日
2012-08

テキストアノテーションワークショップ, 2012年8月6日~7日, 国立情報学研究所
著者
永崎 研宣
出版者
社団法人情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.63, no.9, pp.369-376, 2013-09-01

人文学分野においてもサイバーインフラストラクチャは欠かせないものになりつつある。歴史的には1940年代から取り組みが行われ続けてきたものであり,人文学研究者自身が積極的に取り組んでいくことがこれまで以上に重要になってきている。国際的にはすでに欧米の関連学会によって設立されたADHOを中心として大きな組織的枠組みができあがっており,我国もそこに参画している。個別のテーマとしては知的所有権をはじめ様々な事項に配慮しながら進めていかなければならない。また,評価や教育の体制等については,特に米国では人文学の側で新しい枠組みの構築に向けての取り組みが進みつつある。そこでは,我国の人文学の貢献の余地も大いにあり得る。
著者
明星聖子 永崎 研宣
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告人文科学とコンピュータ(CH) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.49, pp.25-32, 2007-05-25

本稿は、人文科学研究資料のための汎用的なエディティング・システム構築をめぐる研究報告である。まず第一段階として、カフカの文学作品のなかでも編集という点でもっとも複雑な問題を呈している"Der Jaeger Gracchus"のテクストに関する情報を、ドイツ編集文献学の理論に基づき構造化し、それをインド仏教学研究用に開発された文献関連情報データベース上へ実装することを試みている。現在この試みは比較的順調に進行しており、その順調さの背景には、文学と宗教学の文献情報処理の方法の共通性が認められる。今回の研究は、システム開発を通してこうした共通性を検討しながら、汎用的システム設計を支える汎用的な文献学理論を模索することも目的としている。This paper describes the collaborated electronic editing system of Franz Kafka's work that we are now developing. The concept behind this system is based on German scholarly editing theory, especially the methodolgy of historical-critical editing. As the first step of constructing the database, we structured information about Kafka's texts, including historically significant editions and their editorial information (such as pagination and linage). This same information was also cross-referenced. This model was implemented via an existing system originally developed to analyze Buddhist texts.
著者
後藤 真 小風 尚樹 橋本 雄太 小風 綾乃 永崎 研宣
雑誌
じんもんこん2018論文集
巻号頁・発行日
vol.2018, pp.243-248, 2018-11-24

本研究は,日本古代の史料である『延喜式』に対してTEI マークアップを施した際の,マニュアル等の記述の状況について述べたものである.TEI は,広く人文研究のためのテクストを作る国際標準として重要であるものの,そのルールが複雑であり,専門家以外には記述が困難であるという状況がある.また,このようなデータを作成した際に「どのような意図でデータを作ったのか」を記録することで,研究そのものをトレースすることができるようになるとともに,データの長期保存にとっても有益であると考えられる.
著者
永崎 研宣
出版者
デジタルアーカイブ学会
雑誌
デジタルアーカイブ学会誌 (ISSN:24329762)
巻号頁・発行日
vol.2, no.2, pp.111-114, 2018-03-09 (Released:2018-05-18)

国際的な画像共有の枠組みIIIFは世界的に大きな広まりをみせつつ、日本でも徐々に普及が進みつつある。IIIFにはいくつかの課題があるものの、コミュニティによって解決へと進められつつある。一方、IIIFに限らず、高精細画像の公開・共有につきものの課題もあるが、これがIIIFの課題と混同される例もある。そこで、本発表では、高精細画像の公開・共有における課題とIIIFにおける技術面・運用面での課題とを切り分けてそれぞれに提示するとともに、その解決方法について検討する。
著者
永崎 研宣
出版者
一般社団法人 情報科学技術協会
雑誌
情報の科学と技術 (ISSN:09133801)
巻号頁・発行日
vol.64, no.11, pp.475-480, 2014-11-01 (Released:2017-04-13)

クラウドソーシングによるテクストのデジタル翻刻は近年欧米で流行しつつある。そもそもデジタルテクストには典拠と典拠性の確保という難しさがあるが,国立国会図書館近代デジタルライブラリーのデジタル化資料に対するデジタル翻刻では永続的識別子を前提としてその問題を解決可能である。また,明治大正期の活字字形のデジタル翻刻の難しさという問題もある。それらを踏まえた上で日本語クラウドソーシング翻刻環境を実現すべく「翻デジ2014」が開発・公開された。「翻デジ2014」では,単に本を丸ごと翻刻するというだけでなく,一部でもテクスト入力しておけばGoogle等の検索対象となってそこから近デジ本文画像へとリンクされるため,比較的容易に,近代日本の知をWebに結びつけることが可能となっている。
著者
永崎 研宣
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:21888957)
巻号頁・発行日
vol.2017-CH-113, no.6, pp.1-6, 2017-01-28

本稿は,人文系研究データの共有にあたって近年広まりつつあるオープンデータと IIIF という二つの潮流について,それぞれの意義 ・ 可能性 ・ 課題について,論点を整理しつつ今後を見通すことを目指すものである.オープンデータに関しては,デジタル画像資料の利用のしやすさや永続性という点ではメリットをもたらし得るが,異版の登場 ・ 乱立や一次配付元の活動の意義の説明に問題を生じる可能性があり,これを踏まえた評価方法を確立する必要がある.IIIF に関しては,一次配付元の存在感が高まる可能性がある一方で,責任も大きくなる.また,技術的課題もいくつか存在しており,解決に向けての国際的な協調も必要である.
著者
永崎 研宣
雑誌
じんもんこん2007論文集
巻号頁・発行日
vol.2017, pp.347-354, 2007-12-13

デジタル・アーカイブは誰が何をするために作られたのか。それによって誰に利害があるのか。このことについては、デジタル・アーカイブが構築されるたびに、プロジェクトの中で、あるいは、それに関心を持つ人々との間で議論が行われているだろう。あるいは、議論するまでもなく、関係者の問に暗黙の了解があるかもしれない。デジタル・アーカイブに利害関係を持つのは、利用者だけではなく、そのコンテンツの性質に応じて、それに利害を持つ様々な関係者が関わることになる。本稿では、それらの関係者を総称するために「ステイクホルダー」という言葉を用い、その広がりについて概観するとともに、それを下敷きにしつつ、仏教文献デジタル・アーカイブの「利用者」を再考し、デジタル・アーカイブにおける利用者の区別と、そこにある問題点と可能性について検討する。
著者
永崎 研宣
出版者
国公私立大学図書館協力委員会
雑誌
大学図書館研究 (ISSN:03860507)
巻号頁・発行日
vol.104, pp.1-10, 2016

<p>本稿は、大学図書館におけるデジタル人文学の状況について、筆者の知る範囲での現状をお知らせするものである。とりわけ、紙媒体からデジタル媒体へと情報の伝達手段が大きく変化するなかで、情報伝達に大きく依存してきた人文学の変容と、そこにおける大学図書館の役割について、主に米国・英国の事例を参照しつつ、日本の状況とそこへの期待について述べている。</p>
著者
永崎 研宣
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告. SITE, 技術と社会・倫理 (ISSN:09135685)
巻号頁・発行日
vol.103, no.496, pp.13-18, 2003-12-05
被引用文献数
2

インターネットにおいては「匿名性」がしばしば問題にされ、それ自体が-つのコミュニケーションの手段となりつつあると同時に新たな社会問題ともなっている。しかし、インターネット上の匿名の他者を個別の人格として認識することは極めて困難であり、したがって、Web掲示板等における匿名によるコミュニケーションを論じようとしたとき、そもそもそこに本当にコミュニケーションが成立しているかどうかということを証明するのは容易ではない。それは、リモートアドレスの記録やクッキーの利用等、いくつかの手法によってある程度までは確認することが可能だが、究極的には、インターネットの外の世界をも利用して証明する必要がある。
著者
永崎 研宣 清水 元広 下田 正弘
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2013, no.4, pp.1-6, 2013-01-18

コンピュータ上で外字を扱うことは,人文学研究,とりわけ古典を扱う場合には避けることが難しい事柄である.やみくもに外字を増やすことは望ましいことではないが,字形の違いをなかったことにしてしまうことには潜在的な問題がある.したがって,包摂を前提とする UCS 符号化文字集合をそのまま全面的に導入することは困難である. SAT 大蔵経テキストデータベース研究会では,外字の扱いを巡って検討を重ねてきており,近年普及しつつある IVS を利用することで UCS 符号化文字集合の適切な利用方法を模索することを開始すると同時に,約 3000 字の漢字に関して IRG に対して符号化提案を行った.本稿では,そこに至る検討過程について報告するとともに,外字を UCS 符号化提案した際の具体的なデジタル技術の活用の仕方についても紹介する.As a result of the process of encoding all texts in the primary canonical collection of Buddhist scriptures composed in classical Chinese, called the "Taisho Shinshu Daizokyo," (collection of Buddhist canonical texts compiled during the Taisho era) the SAT Daizokyo Text Database Committee began to address UCS encoding of unencoded ideographs contained in this collection. This paper describes the usage of digital technologies for this work and discusses some technical issues concerning unencoded characters in the humanities.
著者
永崎 研宣 苫米地 等流 下田 正弘
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2013, no.1, pp.1-8, 2013-01-18

SAT2012 は,テキスト・データベースの利便性を高めるべく,パラレルコーパス等を構築するとともに,様々な他のリソースとの連携機能を盛り込むなどして公開された新たな Web サービスである.本稿では, SAT2012 構築に際して採用した人文系データベースの構築手法や他のリソースとの連携手法について,近年の Web 技術やデジタル・ヒューマニティーズの手法の流れの中に位置づけつつ報告し,テキスト・データベースの新たな可能性について検討する.The SAT2012 is a new version of a Web service that delivers online Buddhist scriptures along with various cooperative resources as a way of bringing forth the optimum possibilities of a textual database. As the result of a collaborative effort, the SAT database is now seamlessly interacting with several online projects that deal with CJK ideographs, as well as field-oriented bibliographical databases. This paper describes the technical aspects and management of the collaborative works of the SAT2012 by comparing it with recent trends in current Web technologies and the digital humanities, at the same time discussing the possibilities of textual databases in general.