著者
大園 隼彦 片岡 朋子 高橋 菜奈子 田口 忠祐 林 豊 南山 泰之
出版者
国立研究開発法人 科学技術振興機構
雑誌
情報管理 (ISSN:00217298)
巻号頁・発行日
vol.60, no.10, pp.719-729, 2018-01-01 (Released:2018-01-01)
参考文献数
15

日本国内において,機関リポジトリに登録されたコンテンツのメタデータは,junii2を標準的なメタデータスキーマとして,国立情報学研究所(NII)の学術機関リポジトリデータベース(IRDB)を介して広く流通している。近年の学術情報流通をめぐる国際的な状況の変化や技術的な発展に対応し,日本の学術成果の円滑な国際的流通を図るため,オープンアクセスリポジトリ推進協会(JPCOAR)では,junii2に代わる次世代のメタデータスキーマとして,2017年10月に「JPCOARスキーマ ver1.0」を公表した。本稿では,策定過程での議論も含め,新しいメタデータスキーマの考え方と概要を紹介する。
著者
大園 隼彦 片岡 朋子 高橋 菜奈子 田口 忠祐 林 豊 南山 泰之
出版者
国立研究開発法人 科学技術振興機構
雑誌
情報管理
巻号頁・発行日
vol.60, no.10, pp.719-729, 2018

<p>日本国内において,機関リポジトリに登録されたコンテンツのメタデータは,junii2を標準的なメタデータスキーマとして,国立情報学研究所(NII)の学術機関リポジトリデータベース(IRDB)を介して広く流通している。近年の学術情報流通をめぐる国際的な状況の変化や技術的な発展に対応し,日本の学術成果の円滑な国際的流通を図るため,オープンアクセスリポジトリ推進協会(JPCOAR)では,junii2に代わる次世代のメタデータスキーマとして,2017年10月に「JPCOARスキーマ ver1.0」を公表した。本稿では,策定過程での議論も含め,新しいメタデータスキーマの考え方と概要を紹介する。</p>
著者
片岡 朋子 片岡 裕 上園 一知 辰巳 丈夫 吉田順一 筧 捷彦 小原 啓義
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告人文科学とコンピュータ(CH) (ISSN:09196072)
巻号頁・発行日
vol.1996, no.15, pp.61-66, 1996-01-27

蒙古(関連)語は、複数の異なるタイプの文字群で記述されてきた。これらの文字群は、極めて複雑な正書法を持つため、文字コード化及び計算機処理化が進んでいなかった。特にこれらの文字群は、歴史的経緯により、縦書きと横書きでの混在処理が必要とされる。全世界の文字を分析し、一文字の定義と文字を構成する情報を得た。これにより複雑な正書法をもつ蒙古文字に最適な文字コードを決定することができた。この結果、国際化の一環として、蒙古文字を含む全ての文字の混在文書の、単一的機構による一般化した入出力・文書処理が可能となった。Mongolian related languages have been transcribed in different types of scripts which have complicated orthographies - such complexities have inhibited encoding into codesets and text manipulation on computer systems. And it is essential to mix those scripts in both vertical and horizontal directions particularly for historic reasons. Analyses of the scripts in the world have clarified the definition of one character and its constructive information, which made it possible to assign the optimal character codeset(s) for Mongolian scripts having complicated orthographies. As a result, mixed texts of any scripts including Mongolian ones were able to be given generalized I/O and Text Manipulation as internationalization.
著者
小原 啓義 森崎 正人 片岡 朋子 片岡 裕
出版者
早稲田大学
雑誌
基盤研究(A)
巻号頁・発行日
1995

本研究は第1に、ネットワーク・ワイドなMulti-Window Systemsに対応し、それらを国際化する機能モジュール群、すなわち、全文字コードの混在入出力、文字コード非依存の全文字コード混在テキスト処理、ISO 2022/6429を越える通信、Outline Fonts処理、実用に耐える速度と処理能力を持った実用システムとして開発すること目的とする。第2に、これらのモジュール群にMulti-Window SystemsやOSに依存しない高い移植性を持たせ、各種window Systemsに移植し、リアルタイム機能に対応する本格的な国際化マルチ・メディアの基礎ツールとしての実証と、実用システムとしての検証を目的とした。実際の研究としては、まず、全世界の文字の構造と情報交換用文字コードの調査と分類を行った。その結果、文字コードから、処理対象としての文字、文字から表示の二段階の変換を行うことによって、文字コードポイント数、文字、図形数が一致しない、現実の文字列の処理が可能となった。これをもとに、全世界の文字の混在が可能な、入力、出力、基本文書編集(挿入、削除、検索等)及び通信の各モジュール並びにOSへの移植用ライブラリーを作成することを目標として研究と開発を進めた。その結果、POSIXオペレーティング・システムとX Window Systemのスーパーセットとして動作するモジュール群を開発した。既開発の要素技術を基に、既に作成したフォントを用いての、国際化X Window System・ライブラリを開発した。文字コードの規格が存在しない歴史的文字を含む文字対応への検証のため、蒙古系文字群のコード化とフォントの作成を行なった。さらに、結合音節文字の一文字決定のルールを明確にした。その結果、高速な動作が実証され、地域化・国際化・多言語化の明確な定義とその統一モデルが得られた。さらに、蒙古系文字群への対応によって、歴史的文字を含め、適応範囲の広さと実用性を実証した。
著者
上園 一知 大矢 俊夫 片岡 朋子 片岡 裕 小原 啓義
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告. HI,ヒューマンインタフェース研究会報告 (ISSN:09196072)
巻号頁・発行日
vol.70, pp.55-62, 1997-01-16
被引用文献数
2

コンピュータネットワークは国際的な発展を遂げたにも関わらず、コンピュータで同時に扱える文字種は制限されているのが現状である。真の国際化計算機環境を実現するためには、既存の文字コードを超えて全ての文字・言語を同時に混在使用可能であることが必須条件となる。特に出力に関しては、表示される文字図形と文字・文字コードの写像関係が常に言語に依存すると見なされ、更に横書き・縦書きといった文字列の表記方向が混在するために,全世界の文字・言語を全て網羅することは非常に複雑で、一般に不可能と考えられてきた。しかし、世界中の文字・文字コード・正書法を分析した結果、少数の関数で図形決定が可能であり、更にその配置手法が明らかとなった。この関数をハードコーデッドせずに実装することで、全世界の文字廟言語が混在したテキストを単一システムで表示可能となった。
著者
千種 眞一 片岡 朋子
出版者
東北大学
雑誌
萌芽研究
巻号頁・発行日
2001

従来の文字類型学を概観し,系統発生的な進化の最高段階としてのアルファベットを基盤とする文字学が東アジア文字文化圏の漢字その他の文字に関する形字法に基づく文字類型学を不十分にしか扱えないことを論じた。そして自足型アルファベット・アルファベット包含型表語文字組織・アルファベット排他的記憶型文字組織からなる文字の音韻形態的分類を柱とする文字類型学によって提案されている進化論的モデルを適用して、日本文字における漢字仮名まじり文という書記体系や音読み・訓読みのシステムを考察することにより、進化論的モデルから見て、日本漢字が中国漢字よりも明らかに表語的な文字としてきわめて興味深い事例であることを明らかにした。大和語に対する中国漢字のいわゆる訓読みの現象が、漢字のもつ本来の音声的な関係を捨象して、もっぱら表語的に利用されている文字も可能だという意味からである。漢字の認知文字論的な考察では、形字法的な観点から日本の常用漢字、とくに形声字に焦点を当てながら、独体字・合体字の構成に関して、いわゆる部首を意味範疇認知情報単位、音符を音声認知情報単位、字訓語(あるいは字音語)を意味認知情報単位と捉えなおすことによって、漢字の認知文字論的な分析の可能性を示した。部首別・音符別の漢字分布などを調査して、部首が意味範疇認知情報単位として十全に機能しているものから、さらに情報検索指標として、そして単なる文字構成要素としてほとんど字形の中に埋没しているようなものに至るまでさまざまな機能の仕方を見せていること、音声認知情報単位としての音符も意味の共通性を明確に認知させるほどには機能していないこと、しかしながらこうした状況があるからこそ、これらの意味範疇的あるいは音声的情報だけでなく、複合文字表現のもたらす情報をも駆使して、漢字の認知プロセスが成功裡に行われているということを明らかにした。
著者
上園 一知 片岡 朋子 筧 捷彦
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.1999, no.62, pp.57-64, 1999-07-22

インターネットなどの情報通信で使用できる文字はラテンアルファベットが主流であり、ネットワークの国際化の反面、未だ母語を利用できず、ソフトウェアの国際化は進んでいないのが現状である。World Wide WebにおいてもHTML自身の仕様とWeb Browserが特定のエンコーディングを対象としているため、任意に文字を混在させて利用可能な国際化の実現が困難である。そこで、X Window System上で開発した国際化ライブラリであるSystem 1を利用し、国際化Web Browserの開発を行っている。本稿では、HTML文書の表示と文字列検索を考察し、Web Browserに必要な機能について述べる。Even in such a highly cross-communicated society, the almost only script available in any computing network is still Latin alphabet, for which many native users cannot make full use of their own scripts. In the WWW environment as well, the true internationalization with any number of script mixed is hard to realize due to the specification of HTML itself and the specific encoding(s) of a Web Browser. To realize true internationalized computing, Internationalized Web Browser has been developing using internationalized library called System 1, which has already developed on X window system. This paper describes the methods and functions to display and search character strings in HTML documents on the Web Browser.