北上 始 館野 義男 五條堀 孝
vol.1994, no.44, pp.17-26, 1994-05-27

三大国際DNAデータバンク(日、米、欧)で利用されている生物分類樹データベースは、全て、コンピュータを用いた生物学の研究に有用な電子化辞書である。しかしながら、それらの生物分類樹データベースは、無矛盾に統合化されていない。もし、それらが統合化されれば、統合化された電子化辞書を用いて、生物研究結果の間の比較や既存の研究結果から将来の研究方向の選択などに利用することができる。また、形態学上のデータから計算された生物分類樹と分子データから推論された分子進化系統樹との間を比較するのにも有効である。ここでは、生物分類樹データベースの無矛盾な統合化のために、既存の生物分類樹データベースを無矛盾にする方法について述べられている。データベースの矛盾は、生物学が、近年、急速に発展していることにより生じている。即ち、この急速な発達により、生物分類樹の再構成が頻繁に行われてるが、現存のデータベースにはそれが十分に行われていないのである。この矛盾解消のために、近傍検索によるエラー診断、統合性制約による矛盾ノード抽出、エラー修正ツールなどについて述べられている。また、分散環境における矛盾抽出方法についても述べられている。以上は、全て、関係データベース管理システムを用いて実現されている。All the taxonomy databases constructed with the DNA databases of the international DNA data banks are powerful electronic dictionaries which aid in biological research by computer. The taxonomy databases are, however not consistently unified with a relational format, If we can achieve consistent unification of the taxonomy databases, it will be useful in comparing many research results, and investigating future research directions from existent research results. In particular, it will be useful in comparing relationships between phylogenetic trees inferred from molecular data and those constructed from morphological data. The goal of the present study is to unify the existent taxonomy databases and eliminate inconsistencies (errors) that are present in them. Inconsistencies occur particularly in the restructuring of the existent taxonomy databases, since classification rules for constructing the taxonomy have rapidly changed with biological advancements. A repair system is needed to remove in consistencies in each data bank and mismatches among data banks. This paper describes a new methodology for removing both inconsistencies and mismatches from the databases on a distributed computer environment. The methodology is implemented in a relational database management system, SYBASE.