著者
高畠 和輝 伊澤 和輝 秋川 元宏 大上 雅史 秋山 泰
雑誌
研究報告バイオ情報学(BIO) (ISSN:21888590)
巻号頁・発行日
vol.2020-BIO-61, no.10, pp.1-6, 2020-03-05

土壌や海洋,生体内などの環境に生息する微生物を網羅的に解析するメタゲノム解析の手法の一つとして,大量のシークエンスデータに高精度な配列相同性検索を行うものがある.従来法である BLAST などの配列相同性検索ツールでは,最新の次世代 DNA シーケンサーのスループットに対して計算速度が不十分であり,前述のような解析のボトルネックとなっている.本研究では,データベース配列とクエリ配列の間で類似度の高い部分配列を二段階で探索し,各段階において文字数の異なる圧縮アミノ酸集合を適用することで,高精度かつ高速な相同性検索を行う新たなアルゴリズムの提案・実装を行った.また評価実験により,従来手法と比較した際の提案手法の有効性を確認した.