- 著者
-
松本 行弘
縄手 雅彦
- 出版者
- 一般社団法人情報処理学会
- 雑誌
- 情報処理学会論文誌 (ISSN:18827764)
- 巻号頁・発行日
- vol.46, no.11, pp.2633-2642, 2005-11-15
- 被引用文献数
-
2
テキスト処理において文字集合間の変換は,さまざまな問題を引き起こす可能性がある.そのような問題を回避するため,スクリプト言語Rubyに対して,複数の文字集合とそのエンコーディングを変換を行うことなく直接扱うことができる多言語テキスト処理の枠組みを実装した.この多言語テキスト処理の枠組みを利用することでEBCDIC,UTF-16,UTF-32,GB18030をはじめとする各種CESに比較的容易に対応できる.この多言語化により,Rubyを用いたテキスト処理の可能性が大きく広がる.また,この多言語テキスト処理のための枠組みはRubyに依存しないため,ライブラリとして他のプログラムにも応用できる.The character conversion between character code sets can cause various problems. To avoid these problems, we developed a multilingual text manipulation framework for the Ruby language, which the author designed. Users can easily add support for the new character encoding scheme (CES), such as EBCDIC, UTF-16, UTF-32, and GB18030. The multilingual text manipulation will broaden the application domain of the Ruby language. In addition, the framework for the multilingual text manipulation can be used for other programs, since they are idependent from the Ruby interpreter.