著者
馬場 基 中川 正樹 久留島 典子 高田 智和 耒代 誠仁 山本 和明 山田 太造 笹原 宏之 大山 航 中村 覚 渡辺 晃宏 桑田 訓也 山本 祥隆 高田 祐一 星野 安治 上椙 英之 畑野 吉則
出版者
独立行政法人国立文化財機構奈良文化財研究所
雑誌
基盤研究(S)
巻号頁・発行日
2018-06-11

国際的な歴史的文字の連携検索実現のため、「IIIFに基づく歴史的文字研究資源情報と公開の指針」および「オープンデータに関する仕様」(第一版)を、連携各機関(奈良文化財研究所・東京大学史料編纂所・国文学研究資料館・国立国語研究所・京都大学人文学研究所・台湾中央研究院歴史語言研究所)と共同で策定・公表し、機関間連携体制の中核を形成した。また、上記「指針」「仕様」に基づく、機関連携検索ポータルサイト「史的文字データベース連携システム」の実証試験版(奈文研・編纂所・国文研連携)を令和2年3月に公開。令和2年10月には、台湾中研院・国文研・京大人文研のデータを加えて、多言語(英語・繁体中国語・簡体中国語・韓国語)にて本公開を開始した(https://mojiportal.nabunken.go.jp/)。なお、連携・サイト公開は、国内および台湾メディアで報道された。木簡情報の研究資源化として、既存の木簡文字画像(約10万文字)をIIIF形式に変換した。また、IIIF用の文字画像切出ツールを開発し、新規に約15,000文字(延べ)のデータを作成した。過年度と合わせて合計約115,000文字の研究資源化を実現した。文字に関する知識の集積作業として、木簡文字観察記録シートを約50,000文字(延べ)作成した。なお、同シートによる分析が、中国簡牘・韓国木簡にも有効であることが確認されたことを踏まえ、東アジア各地の簡牘・木簡文字の観察作業も実施した。国際共同研究・学際研究として、令和1年9月に、東アジア木簡に関する国際学会を共催した(北京)。当初、国際学会の開催は、研究計画後半での実施を予定していたが、本研究遂行にあたっての共同研究等の中で、学会共催の呼びかけを受け、予定を繰り上げて国際学会を共催した。また、人文情報学の国内シンポジウム等において、IIIF連携等本研究の成果を報告した。
著者
山田 太造
雑誌
情報処理
巻号頁・発行日
vol.57, no.4, pp.404-405, 2016-03-15
著者
山田 太造
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2015-CH-105, no.4, pp.1-6, 2015-01-24

本研究は,地域研究史資料を対象として,記述内容における時空間変化を追跡可能なデータ構造の確立を目指す.本報告では特に,本研究における地域研究史資料からのテキスト作成,テキストからの時空間情報の抽出・トピックの検出の各手法について述べる.
著者
山田 太造 古瀬 蔵 安達 文夫
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2012, no.9, pp.1-8, 2012-10-05

人間文化研究機構は,人文科学研究資源を一元的かつ網羅的に活用できる環境を目的として nihuINT を構築した.本稿では,人文科学研究資源から利用者が求める検索結果を得るための探索支援の方法について述べる.In order to construct an environment where research resources of humanities can be leveraged centrally and comprehensived, National Institutes for the Humanities (NIHU) have developed an integrated retrieval system called nihuINT. In this paper we describe a method of an exploring support which enables a user to obtain from the resources.
著者
保谷 徹 松井 洋子 柴山 守 谷本 晃久 岡 美穂子 五百籏頭 薫 原 正一郎 原山 浩介 須田 牧子 小野 将 山田 太造 横山 伊徳 佐藤 雄介
出版者
東京大学
雑誌
基盤研究(S)
巻号頁・発行日
2014-05-30

本研究では、東京大学史料編纂所の海外史料マイクロフィルム約150万コマ等をデジタルアーカイヴ化し、国内採訪史料とともに学術資源として閲覧公開をはかる。また、在外日本関係史料の調査・収集を進め、マルチリンガル、マルチアーカイヴァルなプロジェクト研究を推進する。①デジタルアーカイヴ構築の面ではマイクロフィルム全2739本からのデジタル画像データのサーバ登録を完了し、このうち約85%については簡易目録ベースでの公開を開始している。今年度は新規収集分を含めて約38万コマを公開データに追加し、累計185万コマとなった。②社会連携・地域連携の試みとして、英国外務省文書FO46(TNA原蔵)に続き、横浜開港資料館所蔵FO262(英国外務省駐日公館文書)マイクロフィルム(約20万コマ)をデジタル化した。史料編纂所と開港資料館でのFO262全体(28万コマ)の検索・閲覧を実現する。③ロシア国立歴史文書館長らを招聘した「日露関係史料をめぐる国際研究集会」をした(5月、東京本郷、日本学士院・東京大学史料編纂所で共催)をはじめ、計3回の国際研究集会を実施して研究成果を発表・発信した。④『ロシア国立海軍文書館所蔵日本関係史料解説目録2』を刊行し、ロシア国立歴史文書館所蔵東アジア三国関係史料解説目録の作成・提供を受けた。⑤各重点プロジェクトで日本関係史料調査と目録研究を実施し、とくに、ロシア両文書館での継続的な史料収集やロシア国立サンクトペテルブルク図書館での史料画像データ収集、ハワイ州立文書館での新規撮影約3500コマなど、さらに古写真史料集『高精細画像で甦る幕末・明治初期日本―ブルガー&モーザーのガラス原板写真コレクション―』(洋泉社)の刊行などの成果があった。⑥前項の海外史料調査・収集の成果に対する社会的反響は大きく、今年度も毎日新聞・読売新聞・朝日新聞・NHK報道などで大きく取り上げられた。
著者
林 譲 横山 伊徳 加藤 友康 保谷 徹 久留島 典子 山家 浩樹 石川 徹也 井上 聡 榎原 雅治 遠藤 基郎 大内 英範 尾上 陽介 金子 拓 木村 直樹 小宮 木代良 近藤 成一 末柄 豊 藤原 重雄 松澤 克行 山田 太造 赤石 美奈 黒田 日出男 高橋 典幸 石川 寛夫
出版者
東京大学
雑誌
基盤研究(S)
巻号頁・発行日
2008-05-12

東京大学史料編纂所が60年間にわたって収集・蓄積した採訪史料マイクロフィルムをデジタル化し、ボーンデジタルによる収集の仕様を確立し、一点目録情報などのメタデータを付与したデジタルデータを格納するアーカイヴハブ(デジタル画像史料収蔵庫)を構築し公開した。あわせて、デジタル画像史料群に基づく先端的プロジェクト・歴史オントロジー構築の研究を推進し、研究成果を公開した。
著者
大内 英範 山田 太造 高橋 典幸 綱川 歩美 林 譲 保谷 徹 山家 浩樹 横山 伊徳
雑誌
じんもんこん2011論文集
巻号頁・発行日
vol.2011, no.8, pp.105-110, 2011-12-03

Hi-CAT Plus は,採訪マイクロフィルムをデジタル化した画像の検索・閲覧システムとして開発され,史料編纂所閲覧室内の端末でサービスをはじめた.本システムの仕組みや既存システムとの連携,上記用途にとどまらない今後の展望などについて述べる.
著者
西田 友広 佐藤 雄基 守田 逸人 深川 大路 井上 聡 三輪 眞嗣 高橋 悠介 貫井 裕恵 山田 太造 堀川 康史 中村 覚 高田 智和
出版者
東京大学
雑誌
基盤研究(A)
巻号頁・発行日
2021-04-05

日本中世史学は、徹底的な史料批判を実践することで、歴史像の厳密な再構成につとめてきた。しかしながら厳密性を追究した結果、分析対象から漏れてしまう史料も生み出してしまった。それらは断簡・無年号文書・破損汚損文書といった、史料批判の構成要件を満たせなかったものである。本研究は、隣接諸科学を含めたあらゆる方法論を援用し、かつ情報化されたデータをあまねく参照できる環境を整えることで、こうした史料の可能性を徹底的に追究し、有効な研究資源とすることを目指している。併せて、かつて確かに存在していた文書の痕跡を伝来史料から丹念に抽出することで、現存史料の背景に広がる、浩瀚な史料世界の復元に取り組んでゆく。
著者
高田 智和 盛 思超 山田 太造
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2012-CH-93, no.2, pp.1-7, 2012-01-20

いわゆる 「異体字」 の概念を漢字の派生関係と通用関係とに整理した上で,人間文化研究機構研究資源共有化統合検索システムでの運用を想定し,検索のための必要最低限の 「異体字」 群を収録した異体漢字対応テーブルの作成事例を報告する。
著者
近藤 成一 海老澤 衷 稲葉 伸道 本多 博之 柳原 敏昭 高橋 敏子 遠藤 基郎 渡邉 正男 神野 潔 野村 朋弘 金子 拓 西田 友広 遠藤 珠紀 山田 太造 岡本 隆明
出版者
放送大学
雑誌
基盤研究(A)
巻号頁・発行日
2013-04-01

未刊古文書釈文作成のための協調作業環境を構築することにより、未刊古文書の釈文を歴史学のコミュニティにおいて協同で行うことを提起し、史料編纂のあり方について新たな可能性を模索するとともに、歴史学のコミュニティの実体形成にも寄与する基礎とした。釈文作成のために外部から自由な書き込みを許す部分と、作成された成果を史料編纂所の管理のもとに公開する部分を構築し、前者から後者にデータを選択して移行するシステムを設けた。
著者
山田 太造
出版者
東京大学
雑誌
若手研究(B)
巻号頁・発行日
2014-04-01

本研究では日本史学研究における研究過程支援のため,史料目録・テキスト等から史学的知識を抽出し,知識間・知識-史料間・史料間などの関係を明確にしながら,内在する史学的知識・暗黙知を外在化する研究を行うため,特に(1)史学的知識の抽出・蓄積,(2)史学的知識間,史料学的知識-史料間,史料間の関連性の検出,(3)知識表現・関連表現とそれらを用いた検索手法の確立を目指した.
著者
久留島 典子 林 譲 本郷 恵子 柴山 守 有川 正俊 山口 英男 遠藤 基郎 木村 直樹 山家 浩樹 馬場 基 山田 太造 近藤 成一 小宮 木代良 古瀬 蔵
出版者
東京大学
雑誌
基盤研究(A)
巻号頁・発行日
2014-04-01

前年度に引き続き東大史料編纂所歴史情報システム(以下、SHIPSと略記)が擁するDB群から、各DBに格納された人物情報を抽出し、人物情報レポジトリへとデータ移行を推進した。レポジトリへ移行を可能とするDB数もさらに2つ増加し、計19種へと拡大することで、総登録データ数は約42万件に達した。前近代における人物情報を総覧する環境が整いつつあり、これを軸として、地理情報・史料典拠情報・史料目録情報といった情報との連接を視野に入れたところである。SHIPS-DBから人物情報レポジトリを参照・応答するAPIについては、前年度に構築したシステムを基盤として、より詳細な応答を実現するモジュールを「新花押データベース」内に実装した。花押を記した人物を比定するために、随意にレポジトリ参照が可能となったことは、より正確な情報蓄積を進めるうえで極めて有効と言ってよい。また人物レポジトリを直接検索するためのインターフェイス(「人名典拠サービスモジュール」)が安定的に運用されるに至り、多様な検索に応答しうる環境が整備されつつある。蓄積データのシームレスな運用という観点からは、前年度に引き続き、人物情報レポジトリ総体のRDFストア化を推進し、検索結果をRDF形式で出力するためのAPIの安定運用を実践することで、オープンデータ環境への移行を目指した。地理情報レポジトリについては、外部参照用APIの運用を開始し、国立歴史民俗博物館の「荘園データベース」との連携を実現した。
著者
山田 太造 井上 聡
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:21888957)
巻号頁・発行日
vol.2016-CH-109, no.2, pp.1-4, 2016-01-23

東京大学史料編纂所では前近代日本史・史料学研究に関わる 30 もの DB を公開している.これらの DB の多くは人物に関わるデータを含んでおり,史料テキスト内に出現した人名・その人物の別称・官位,肖像・写真,花押,さらに人名辞典などがあり,多様である.本研究では,人物に関わる多様なデータを収集・蓄積するために構築している 「人名リポジトリ」 について紹介する.
著者
山田 太造 井上 聡 山家 浩樹
雑誌
じんもんこん2019論文集
巻号頁・発行日
vol.2019, pp.3-10, 2019-12-07

本論文では,歴史データを対象に,史料データの収集・蓄積・分析・提示・提供といったデータ流通基盤の整備を目的とし,史料や派生する歴史データを蓄積していくために構築を進めたデータリポジトリと,そこに蓄積したデータを分析し提示・提供していくための手法について述べる.
著者
山田 太造
出版者
情報知識学会
雑誌
情報知識学会誌 (ISSN:09171436)
巻号頁・発行日
vol.25, no.4, pp.315-324, 2015-12-12 (Released:2016-03-11)
参考文献数
8
被引用文献数
2

フィールドノートは調査したフィールドの観察記録,観察したフィールドの場所・日時,その風景に関するスケッチ・写真などで構成されたものである.調査対象であるフィールドについて特定の日時での様子を詳細に理解することができるため,地域研究において非常に重要な研究資源の1つといえる.われわれはこれまでに,地域研究進展のためにフィールドノートを効率的かつ効果的に利用していく手法を模索しており,本研究ではテキストマイニングを用いてフィールドノートから記述されている場面を特徴づけ,かつセマンティックウェブを利用して表現する手法を提案する.
著者
古瀬 蔵 相田 満 青田 寿美 鈴木 淳 大内 英範 山田 太造 五島 敏芳 後藤 真
出版者
国文学研究資料館
雑誌
基盤研究(B)
巻号頁・発行日
2016-04-01

日本文学分野およびその隣接領域のデータベースについて、情報連携の仕組みを導入することと、オープンデータ化の環境を整備することである。データベース単位だけでなく、データベースの中の個々のレコード単位で情報を連携させ、異分野を含む様々なデータベースとの相互運用を実現し、日本文学研究者に限らず多くのインターネット利用者に、日本文学の情報を知らせ利用してもらう環境作りを行うために、案内型検索を中心に日本文学関連のデータベースの情報アクセスの研究を行った。今年度は、情報収集型検索での情報アクセス支援の検討を重点的に行っていくために、まず当初の目的の情報に到達することを目指すことに加えて、検索結果が利用者にとって予期しない探しているものとは別の価値ある情報を提供し、気付きや発見へ遭遇する機会となるセレンディピティの発現を重視し、研究活動に於いて、その関連する情報を提示する情報連携により、様々なデータベースでの情報空間で連続的に探索を行え、セレンディピティをもたらし知識を広げていくことの活動の様相を重点的に記録してもらった。また、人間文化研究機構の100以上の人文学データベースを検索対象とする統合検索システムnihuINTでも、歴史学や日本文学の一部のデータベースなどを題材に、データベースの情報をRDF(Resource Description Framework)という知識表現形式で表わして、データベース横断での情報連携を実現する試みが始められ、本研究でも、データベースの情報をRDF化して情報連携の仕組みを構築するための開発をおこなった。
著者
山田 太造
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2013, no.6, pp.1-6, 2013-01-18

昨今,日本史史料に関して目録や画像だけでなく本文もデジタル化が進み,公開されつつある.本研究では,日本の南北朝期における史料を対象に,本文を用いて類似する史料を収集し,提示する手法について紹介する.Recently, in Japanese historical material, the amount of encoded texts has been grown up, and encoded texts have been published by web-based systems. In the paper, using similarity between text of Japanese historical materials which are written in Nanboku-cho period of Japan, we introduce a method to collect and represent the materials.
著者
高田 智和 盛 思超 山田 太造
出版者
一般社団法人情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2012, no.2, pp.1-7, 2012-01-20

いわゆる 「異体字」 の概念を漢字の派生関係と通用関係とに整理した上で,人間文化研究機構研究資源共有化統合検索システムでの運用を想定し,検索のための必要最低限の 「異体字」 群を収録した異体漢字対応テーブルの作成事例を報告する。This paper discusses the concept of kanji variants in terms of relationships based on formal derivation, and customary usage, and reports on the production of an optimized table listing kanji variants for use with the Resource Sharing System for the Humanities, with excludes sets of kanji variants, particularly customary usage kanji variants, that can lead to unexpected search results.