- 著者
-
鈴木 脩司
石田 貴士
秋山 泰
- 雑誌
- 研究報告バイオ情報学(BIO)
- 巻号頁・発行日
- vol.2012, no.24, pp.1-7, 2012-06-21
我々は以前に suffix array を用いた高速な相同性検索システムを提案したが,近年の次世代シークエンサーの進歩が目覚ましく,得られる配列データは増加しており,さらなる高速化が必要とされている.このため,本研究では従来システムの改良を試み,長さ L hash のすべての文字列の suffix array の検索結果を予め計算しておき,これを保存しておく.そして,検索の際は L hash 文字目までの検索には保存しておいたものを読み出すことで高速化した.また,このシステムを用いてエピゲノム解析へも対応するために,バイサルファイト処理を行った DNA 断片配列のマッピングができるように改良を行った.We developed the system for fast homology search using suffix array. However, next generation sequencers are improving gradually and become to produce larger data than previous sequencers. Thus, we have developed a new faster system. To accelerate search using suffix array, we store the results of searching patterns whose length is less than Lhash and use them as caches. In addition, we enhanced our system to map bisulfite reads for epigenomics.