- 著者
-
永崎 研宣
清水 元広
下田 正弘
- 雑誌
- 研究報告人文科学とコンピュータ(CH)
- 巻号頁・発行日
- vol.2013-CH-97, no.4, pp.1-6, 2013-01-18
コンピュータ上で外字を扱うことは,人文学研究,とりわけ古典を扱う場合には避けることが難しい事柄である.やみくもに外字を増やすことは望ましいことではないが,字形の違いをなかったことにしてしまうことには潜在的な問題がある.したがって,包摂を前提とする UCS 符号化文字集合をそのまま全面的に導入することは困難である. SAT 大蔵経テキストデータベース研究会では,外字の扱いを巡って検討を重ねてきており,近年普及しつつある IVS を利用することで UCS 符号化文字集合の適切な利用方法を模索することを開始すると同時に,約 3000 字の漢字に関して IRG に対して符号化提案を行った.本稿では,そこに至る検討過程について報告するとともに,外字を UCS 符号化提案した際の具体的なデジタル技術の活用の仕方についても紹介する.