著者
杉浦 典和 石田 貴士 関嶋 政和 秋山 泰
雑誌
研究報告バイオ情報学(BIO)
巻号頁・発行日
vol.2012, no.25, pp.1-7, 2012-06-21

代表的な de novo アセンブラの一つである Velvet は,大規模なゲノムのアセンブリにおいて消費メモリ量の多さが課題とされている.本稿ではハッシュテーブルを分割することで,特に消費メモリ量の多い前半の velveth の消費メモリを削減する手法を提案した.またハッシュテーブルを分割する手法として,新たにリード分割法を提案した.リード分割法の提案により,従来より提案されている k-mer 値に応じた分割法に比べ,少数計算機で実行する際の実行時間の削減に成功した.Velvet is one of the most representative de novo assembler. However it has a problem that its memory consumption is too large for large scale assembling. Here, we propose a method to decrease the memory consumption of velveth which is the first half of Velvet and requires generally larger memory than the remaining half part. We propose a novel hash dividing method by dividing reads. By using this method, we have succeeded to decrease the elapsed time compared to the existing method, which divides a hash table corresponding the k-mer value.