著者
林田守広 阮佩穎 阿久津達也
雑誌
研究報告数理モデル化と問題解決(MPS)
巻号頁・発行日
vol.2014-MPS-100, no.11, pp.1-2, 2014-09-18

生物は進化の過程において,突然変異や組み換えなどによって DNA の塩基配列情報を変化させながらも自らの生命を維持させてきた.生物の持つ情報を DNA の塩基配列とすると,この配列を圧縮することによって大体の情報量を知ることができる.本研究では塩基配列の代わりにタンパク質ドメイン構成に基づき,個体の持つすべてのタンパク質について圧縮する.遺伝子重複や遺伝子融合などの進化現象により同じドメイン構成を持つタンパク質が複数生成されるとすると,複製元のタンパク質を参照することでデータ量を減らすことができる.このような参照によるネットワークは有向ハイパーグラフとなり,多数の参照候補を持つグラフから最小大域木を見つけることで圧縮する.しかし現実的な時間での,ハイパーグラフからの最小大域木の抽出は困難であるので,前処理としてハイパーエッジを削減する発見的な手法を提案する.本手法を数種の生物種に適用した結果,タンパク質進化における遺伝子融合の重要性が示唆された.