著者
孫 建強 湯 敏 清水 謙多郎 門田 幸二
出版者
日本乳酸菌学会
雑誌
日本乳酸菌学会誌 (ISSN:1343327X)
巻号頁・発行日
vol.26, no.2, pp.124-132, 2015-06-29 (Released:2016-07-29)
参考文献数
10

次世代シーケンサー(以下、NGS)データの解析は、大まかに①データ取得、②クオリティコントロール(以下、QC)、③アセンブルやマッピング、④数値解析の4 つのステップに分けられる。連載第4 回は、Bio-Linux にプレインストールされているFastQC(ver. 0.10.1)プログラムを用いたQC の実行および解釈の基本を述べる。また、FASTX-toolkit(ver. 0.0.14)で提供されているアダプター配列除去プログラムであるfastx_clipper の挙動を例に、Linux コマンドを駆使した動作確認の重要性を述べる。多様なインストール手段に対応すべく、apt-get, pip, cpan コマンドを利用したプログラムのインストール(FastQC ver.0.11.3、nkf ver. 2.1.3、cutadapt ver. 1.8.1、HTSeq ver. 0.6.1、FaQCs ver. 1.34)やパスなどの各種設定についても述べる。ウェブサイト(R で)塩基配列解析(URL: http://www.iu.a.u-tokyo.ac.jp/~kadota/r_ seq.html)中に本連載をまとめた項目(URL: http://www.iu.a.u-tokyo.ac.jp/~kadota/r_seq.html#about_ book_JSLAB)が存在する。ウェブ資料(以下、W)や関連ウェブサイトなどのリンク先を効率的に活用してほしい。