著者
飯尾 和彦 木村 聡宏 小林 透 忠海 均
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告デジタルドキュメント(DD) (ISSN:09196072)
巻号頁・発行日
vol.1997, no.49, pp.7-14, 1997-05-23

既存の非SGML文書をSGML文書に変換するためにはDTDに従って多くのタグを人手で文書に埋め込む必要がある。これは、コストがかかり、SGML普及上の大きな問題点となっている。本論文では、既存の非SGML文書をSGML文書に変換する方式とその評価結果について述べる。変換方法は、以下の通りである。()テキスト文書に簡単なタグつけを施す。この結果できた文書を一次変換文書と呼ぶ。()これらのタグと一次変換文書に現れる位置や特徴を手がかりとして、SGML文書へ自動変換する。本方式により、SGMLの経験者がSGMLエディタを利用してSGML文書に変換するような場合と比較しても1/4?1/3の時間でタグつけできることが実験から明らかになった。It is needed to be put many tags into papers when we want to convert non SGML document into SGML document. However it is costly and is one of main problems for utilizing SGML. This paper describes the method to convert non SGML document into SGML document and the evaluation of it. The method is followings: (i) Insert small tag set into text. The resulting document is called first translated document. (ii) Translate first translated document into SGML document automatically by analyzing these tag, location and features. It is found that even SGML expert can convert document three or four times effectively than using SGML editor by using this method.