- 著者
-
永崎 研宣
清水 元広
下田 正弘
- 雑誌
- 研究報告人文科学とコンピュータ(CH)
- 巻号頁・発行日
- vol.2013, no.4, pp.1-6, 2013-01-18
コンピュータ上で外字を扱うことは,人文学研究,とりわけ古典を扱う場合には避けることが難しい事柄である.やみくもに外字を増やすことは望ましいことではないが,字形の違いをなかったことにしてしまうことには潜在的な問題がある.したがって,包摂を前提とする UCS 符号化文字集合をそのまま全面的に導入することは困難である. SAT 大蔵経テキストデータベース研究会では,外字の扱いを巡って検討を重ねてきており,近年普及しつつある IVS を利用することで UCS 符号化文字集合の適切な利用方法を模索することを開始すると同時に,約 3000 字の漢字に関して IRG に対して符号化提案を行った.本稿では,そこに至る検討過程について報告するとともに,外字を UCS 符号化提案した際の具体的なデジタル技術の活用の仕方についても紹介する.As a result of the process of encoding all texts in the primary canonical collection of Buddhist scriptures composed in classical Chinese, called the "Taisho Shinshu Daizokyo," (collection of Buddhist canonical texts compiled during the Taisho era) the SAT Daizokyo Text Database Committee began to address UCS encoding of unencoded ideographs contained in this collection. This paper describes the usage of digital technologies for this work and discusses some technical issues concerning unencoded characters in the humanities.