著者
片岡 朋子 片岡 裕 上園 一知 辰巳 丈夫 吉田順一 筧 捷彦 小原 啓義
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告人文科学とコンピュータ(CH) (ISSN:09196072)
巻号頁・発行日
vol.1996, no.15, pp.61-66, 1996-01-27

蒙古(関連)語は、複数の異なるタイプの文字群で記述されてきた。これらの文字群は、極めて複雑な正書法を持つため、文字コード化及び計算機処理化が進んでいなかった。特にこれらの文字群は、歴史的経緯により、縦書きと横書きでの混在処理が必要とされる。全世界の文字を分析し、一文字の定義と文字を構成する情報を得た。これにより複雑な正書法をもつ蒙古文字に最適な文字コードを決定することができた。この結果、国際化の一環として、蒙古文字を含む全ての文字の混在文書の、単一的機構による一般化した入出力・文書処理が可能となった。Mongolian related languages have been transcribed in different types of scripts which have complicated orthographies - such complexities have inhibited encoding into codesets and text manipulation on computer systems. And it is essential to mix those scripts in both vertical and horizontal directions particularly for historic reasons. Analyses of the scripts in the world have clarified the definition of one character and its constructive information, which made it possible to assign the optimal character codeset(s) for Mongolian scripts having complicated orthographies. As a result, mixed texts of any scripts including Mongolian ones were able to be given generalized I/O and Text Manipulation as internationalization.
著者
上園 一知 大矢 俊夫 片岡 朋子 片岡 裕 小原 啓義
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. HI,ヒューマンインタフェース研究会報告 (ISSN:09196072)
巻号頁・発行日
vol.70, pp.55-62, 1997-01-16
被引用文献数
2

コンピュータネットワークは国際的な発展を遂げたにも関わらず、コンピュータで同時に扱える文字種は制限されているのが現状である。真の国際化計算機環境を実現するためには、既存の文字コードを超えて全ての文字・言語を同時に混在使用可能であることが必須条件となる。特に出力に関しては、表示される文字図形と文字・文字コードの写像関係が常に言語に依存すると見なされ、更に横書き・縦書きといった文字列の表記方向が混在するために,全世界の文字・言語を全て網羅することは非常に複雑で、一般に不可能と考えられてきた。しかし、世界中の文字・文字コード・正書法を分析した結果、少数の関数で図形決定が可能であり、更にその配置手法が明らかとなった。この関数をハードコーデッドせずに実装することで、全世界の文字廟言語が混在したテキストを単一システムで表示可能となった。
著者
上園 一知 片岡 朋子 筧 捷彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.1999, no.62, pp.57-64, 1999-07-22

インターネットなどの情報通信で使用できる文字はラテンアルファベットが主流であり、ネットワークの国際化の反面、未だ母語を利用できず、ソフトウェアの国際化は進んでいないのが現状である。World Wide WebにおいてもHTML自身の仕様とWeb Browserが特定のエンコーディングを対象としているため、任意に文字を混在させて利用可能な国際化の実現が困難である。そこで、X Window System上で開発した国際化ライブラリであるSystem 1を利用し、国際化Web Browserの開発を行っている。本稿では、HTML文書の表示と文字列検索を考察し、Web Browserに必要な機能について述べる。Even in such a highly cross-communicated society, the almost only script available in any computing network is still Latin alphabet, for which many native users cannot make full use of their own scripts. In the WWW environment as well, the true internationalization with any number of script mixed is hard to realize due to the specification of HTML itself and the specific encoding(s) of a Web Browser. To realize true internationalized computing, Internationalized Web Browser has been developing using internationalized library called System 1, which has already developed on X window system. This paper describes the methods and functions to display and search character strings in HTML documents on the Web Browser.