- 著者
-
矢田 哲士
石川 幹人
田中 秀俊
浅井 潔
- 雑誌
- 情報処理学会論文誌 (ISSN:18827764)
- 巻号頁・発行日
- vol.37, no.6, pp.1117-1129, 1996-06-15
我々は DNA配列群からシグナルパターンを自動的に抽出する手法を開発した.本手法では シグナルパターンを確率論的モデルである隠れマルコフモデル(HMM)によって表現している.HMMは 状態を表すノードとそれらを結合する有向パスで構成されるネットワークとして記述される.HMMをシグナルパターンの表現方法として用いる場合 以下の2点が重要な課題となる.(1)最も好ましいネットワークトポロジーの決定 (2)HMMに関連するパラメータの最適化.本手法は 遺伝的アルゴリズム(GA)とBaum-Welchアルゴリズム(BWA)で構成される.手法のプロシジャは以下のとおりである.(1)GAによるネットワークトポロジーと初期パラメータ値の生成 (2)BWAによるパラメータ値の最適化 (3)GAによるネットワークトポロジーと最適化されたパラメータ値の評価.評価には モデルの適合度と複雑性の釣合基準を与える赤池情報量基準(AIC)を適用した.以上のプロシジャを繰り返すことによって DNA配列群に含まれるシグナルパターンを最も良好に表現するHMMネットワークのトポロジーとパラメータ値が得られる.我々は 本手法を霊長類プロモータ領域に関するシグナルパターンの抽出に適用した.本手法により生成されたHMMは 生物学的に知られている複数のシグナル配列を含んでいた.さらに このHMMを用いてプロモータ領域の予測を行った結果 84.3%の精度でプロモータ領域を認識することが確かめられた.この値は 本手法で生成されたHMMがプロモータ領域のシグナルパターンを良好に表現していることを示している.