- 著者
-
陳 致中
- 出版者
- 東京電機大学
- 雑誌
- 基盤研究(C)
- 巻号頁・発行日
- 2002
近似、並列化、randomizationという3つのアプローチを融合して、計算困難な問題を解こうとした。本研究で考えた主な問題は計算的生物学における基本的な問題であった。考えた問題と得た結果は下記のとおりである:まず、tRNAと蛋白質の二次構造解明の研究でEvans氏によって定式化された「弧付き最長共通部分列問題」について研究を行った。Evans氏がこの問題のNP困難性を推測したが、未解決のままにした。本研究で、この問題のNP困難性を証明することに成功した。また、この問題の実用性から、この問題を解くための近似アルゴリズムも開発されている。本研究以前に開発された近似アルゴリズムによって達成される近似率が0.5であった。本研究でこの近似率を一般的に改善できなかったが、2つの重要なスペシャルケースに限っては0.5よりはるかに良い近似率を達成する近似アルゴリズムを開発できた。次に、蛋白質の構造解明に非常に役立つ「蛋白質のNMRスペクトルピーク割り当て問題」について研究を行った。Xu氏らがこの問題を「制限付き二部グラフマッチング問題」として定式化して、そのNP困難性を証明した。また、Xu氏らがこの問題を厳密に解くための(非常に遅くて実用的ではない)アルゴリズムを提案した。本研究で、この問題を解くための高速な近似アルゴリズムを2つ設計した。1つは近似率2を達成する。もう1つは近似率log nを達成する。面白いことに、蛋白質の構造解明の研究で実際に使われたデータを対象に実験したところ、後者の方が前者よりもよい解を出力することが分かった。このことから、理論的に良い近似アルゴリズムよりも実際のデータを考慮した発見的手法によるアルゴリズムの方がよい解を見つける可能性が大きいことが分かる。そこで、本研究で発見的手法によるアルゴリズムを3つ設計した。そして、蛋白質の構造解明の研究で実際に使われたデータを対象に実験したところ、どれもかなり良い解を見つけてくれることが分かった。さらに、生物系統史(phylogeny)の再構築に関する研究で定式化された「k-最近系統史問題」について研究を行った。本研究で、この問題のNP困難性を証明することに成功した。また、入力データにエラーがない場合、この問題を解く線形時間アルゴリズムがあることを証明できた。このアルゴリズムは入力データにエラーがある場合の近似アルゴリズムの設計に役立つ可能性がある。