著者
高橋 洋成
出版者
筑波大学
雑誌
若手研究(B)
巻号頁・発行日
2016-04-01 (Released:2016-04-21)

本研究の目的は、ギルガメシュ叙事詩の古バビロニア語版(前二千年紀初め)と標準版(前二千年紀末)をデジタル的に比較し、言語特徴や表現の違いに着目して、後者が前者をどのように編集し、その背景にあったものは何かを考察することである。ギルガメシュ叙事詩の古バビロニア語版は、完全ではないもの比較的状態の良い2つの資料、すなわちペンシルバニア粘土板(OB II)とイェール版(OB III)が現存している。一方、標準版の粘土板は大きく破片化してはいるものの、研究者らによって粘土板I~XIIとして復元されている。このうち古バビロニア語版と標準版とのまとまった対応が確認されるのは、標準版I~IIIである。以上を踏まえ、平成28年度に実施した研究は次のとおりである。1. 復元された標準版I~III(合計831行)について、転写テキストのデジタル化を行った。具体的には以下の作業である。(1) A. R. George, The Babylonian Gilgamesh Epic (Oxford, 2003)の転写テキストに基づき、Text Encoding Initiative (TEI)に準拠したXMLフォーマットを作成した。(2) 今後、言語特徴や表現の調査を行うために、それぞれの語に対してTEIタグを付け、形態情報を記述した。この際、アッカド語の形態情報を過不足なく記述するために、形態論的な枠組みの精査を行い、それに基づいてタグを整理した。2. 古バビロニア語の粘土板OB II、OB III(合計528行)のデジタル化を開始した。具体的には、それぞれの粘土板をTEIに準拠したXMLフォーマットで記述し、個々の楔形文字および個々の語ごとにタグを付けた。3. 楔形文字粘土板の転写方法について、12月に開催されたデジタル・ヒューマニティーズのワークショップで発表した。
著者
高橋 洋成 永井 正勝 和氣 愛仁
出版者
一般社団法人情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2015, no.5, pp.1-5, 2015-01-24

近年のコンピュータとインターネットの発展に伴い,これまでコンピュータ上では転写テキストとして扱われることの多かった言語資料を,音声,動画,画像と一緒に保存・利用することが容易になった.著者らは古代エジプト神官文字文書,楔形文字粘土板資料,近代日本語文典資料などの文字資料を統一的に扱うための画像データベースと,World Wide Web 上のプラットフォームを構築している.さらに,本プラットフォームは次の 2 点を目指している.(1) 本プラットフォームの内部に格納された言語資料および研究データを,外部に保存し共有するために Text Encoding Initiative (TEI) を利用すること.(2) データの保存と共有をさらに促進させるために,言語資料と研究データに関する RDF トリプルを生成し,Linked Open Data (LOD) として提供すること.本稿はこの 2 点について,現在までの取り組みと具体例を報告する.Recent development of the internet and computer technologies makes it easier to compile various linguistic materials such as audios, videos and photos with their transliteration texts together. The authors are constructing the general-purpose image database and the platform on World Wide Web for the linguistic studies on hieratic texts of Ancient Egypt, cuneiform tablets of Ancient Orient, and Modern Japanese Grammar Textbooks. The platform aims on the following two points: (1) to use Text Encoding Initiative (TEI) for preservation and sharing of the internal data with its outer world, (2) to create sharable RDF triples from the data to provide them as Linked Open Data (LOD). The current snapshot of the developing platform will be discussed.
著者
和氣 愛仁 矢澤 真人 宇陀 則彦 永井 正勝 高橋 洋成
巻号頁・発行日
2013-04-01 (Released:2014-07-25)

最終年度は、前年度までに構築した古代エジプト語神官文字データベース、明治期日本語文典資料データベース、古代シュメール・アッカド語楔形文字データベースの3つを内部的に統合し、他の言語資料にも適用可能な標準パッケージの試作を行った。また、挿絵等の自由領域と文字・語とを関連づけることが可能なようにデータ構造の拡張を行った。さらに、全文テキスト検索およびテキスト出力機能の試験的実装を行った。研究期間全体を通じては、複数種類の歴史的な言語資料を中心に扱い、それらの言語における文字・語・文・文章をまとめて統一的に扱うことのできる、共通のデータ構造を定義した。また、Drupal(代表的なCMSのひとつ)等の各種オープンソースソフトウェアや、JavaScript、HTML5等のウェブ標準技術を用いて、ユーザビリティに優れたインターフェイスを構築した。また、TEIやRDFといった形式のXMLファイルを出力することによって、外部システムとのデータ交換にも対応できるようにした。これらのことにより、複数言語資料を統一的な方法で取り扱うことのできる汎用的なデータベースプラットフォームの基礎を構築することができた。このプラットフォームは、パソコンをはじめ、今日一般にかなり浸透しているタブレット端末やスマートフォンを通じても利用することができる。手近な端末を利用して歴史的資料画像からテキストを手軽に検索できることは、研究者にとっても一般向けにとっても極めて重要な意味を持つ。
著者
高橋 洋成
出版者
一般社団法人情報処理学会
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2013, no.6, pp.1-7, 2013-07-27

本報告は,紀元前 14 世紀のエジプトとパレスチナとの間でやり取りされた書簡 (アマルナ文書) の電子化について,これまでの経緯,現状および将来の展望について報告する.具体的には,TEI/XML を利用して画像・文字・翻字・言語解釈の各データを有機的に関連付ける方法と,作成されたデータを開かれた言語研究のネットワーク (LLOD) に参加させていく必要性について述べる.This paper describes the background and current approach to the digitalization of Amarna letters, most of which were diplomatic documents between Egypt and Palestina in 14 BCE. Using TEI/XML, images, cuneiforms, transliteration and linguistic analysis are systematically combined, which in turn are intended to contribute to the open network of linguistic studies, called LLOD.