著者
矢田 哲士 石川 幹人 田中 秀俊 浅井 潔
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.37, no.6, pp.1117-1129, 1996-06-15

我々は DNA配列群からシグナルパターンを自動的に抽出する手法を開発した.本手法では シグナルパターンを確率論的モデルである隠れマルコフモデル(HMM)によって表現している.HMMは 状態を表すノードとそれらを結合する有向パスで構成されるネットワークとして記述される.HMMをシグナルパターンの表現方法として用いる場合 以下の2点が重要な課題となる.(1)最も好ましいネットワークトポロジーの決定 (2)HMMに関連するパラメータの最適化.本手法は 遺伝的アルゴリズム(GA)とBaum-Welchアルゴリズム(BWA)で構成される.手法のプロシジャは以下のとおりである.(1)GAによるネットワークトポロジーと初期パラメータ値の生成 (2)BWAによるパラメータ値の最適化 (3)GAによるネットワークトポロジーと最適化されたパラメータ値の評価.評価には モデルの適合度と複雑性の釣合基準を与える赤池情報量基準(AIC)を適用した.以上のプロシジャを繰り返すことによって DNA配列群に含まれるシグナルパターンを最も良好に表現するHMMネットワークのトポロジーとパラメータ値が得られる.我々は 本手法を霊長類プロモータ領域に関するシグナルパターンの抽出に適用した.本手法により生成されたHMMは 生物学的に知られている複数のシグナル配列を含んでいた.さらに このHMMを用いてプロモータ領域の予測を行った結果 84.3%の精度でプロモータ領域を認識することが確かめられた.この値は 本手法で生成されたHMMがプロモータ領域のシグナルパターンを良好に表現していることを示している.