著者
斎藤 秀紀 菱沼 透 横山 詔一 柳沢 好昭 大坪 一夫
出版者
国立国語研究所
雑誌
特定領域研究(A)
巻号頁・発行日
1998

本年度は、次ぎに示す4項目の研究を行った。(1) 「漢字符号への二律背反機能の実装」現在、使用されている漢字符号には、種々の機能不足が指摘されている。代表的な事柄には、使用できる文字の拡張に対する要望と、適正規模の文字集合による処理の効率化の対立がある。本報告は、これらの対立する二つの関係を構造化4バイトコードに要求する機能として、構造の要素と構造および構造間の関係を使い規定する方法を述べた。(2) 「インターネットでの日本語教育リソース提供の試み」本研究では,海外で日本語教育大学機関及び富士通と日立ソフトエンジニアリングの協力を得て,協働学習による日本語学習リソースの授受を試行した。これにより,日本語学習リソース提供についての幾つかの課題は,受信側である現地機関側のコンピュータ及びネットワーク環境の整備,送受信双方で使用できるツールやユーティリティの選択,発信側のデータの作成方法の検討により解決することが判明した。(3) 「『新聞電子メディアの漢字』調査について」実際の新聞紙面とそのCD-ROMを詳細に照合して漢字の出現頻度を調査した。紙面に出現したJISにない漢字(JIS外漢字)254字については、TrueTypeFontoを開発し、合計6.611文字の漢字頻度表を作成した。(4) 「中国語情報科学用語における漢字の特性」日本語と中国語の情報科学用語を比較した場合、日本語はカタカナ表記の語が多いのに対し、中国語は漢字表記である。表記上の差異は、中国人の日本語学習者に負担となっている。表記上の差異に関わらず、日本語・中国語とも出自はほとんどが英語である。以上の考え方に基づき英語(原語)を媒介として中国語漢字とカタカナ語を含めた日本語の情報科学用語との対応を調べ、中国漢字1字との対応表を作成した。
著者
斎藤秀紀
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.35, no.6, pp.1119-1126, 1994-06-15
被引用文献数
2

JIS X 0208には、符号間への文字の挿入機能の欠如や中国・韓国語への拡張機能の問題がある。本研究では、諸橋轍次編「大漢和辞典」の検字番号に墓づく構造化4バイトコードの符号化法と活用法を述ぺた。最初に、4バイトコードの構造を(1)大漢和辞典の検字番号を16進化94進数変換した整数部3バイトと小数部1パイト符号(2)既存の2バイトコードを統合した符号(3)2の8ビット目が'01'である符号を2個結合した3種にまとめ、これらが画数・読み・部首情報の漢和辞書による基準化、多国語の表現、一字体一符号化を実現できることを示した。次に、符号間への文字の追加機能をつかった一字体一符号化法が、文字集合と漢字符号の固定や文字集合間の互換性を維持した文字集合の分割に利用できることを述べた。最後に、4バイトコードの機能をワークステーション(EWS?4800)とパーソナルコンピュータ(PC-9800)間のデータ伝送を通して検証した。その結果、4バイトコードは、JISX0208?1978の見直しで生じたデータ間の互換性を崩す問題を解決でき、異機種間の共通符号にも使用できる見通しをえた。