- 著者
-
門田 幸二
- 出版者
- 東京大学
- 雑誌
- 基盤研究(C)
- 巻号頁・発行日
- 2018-04-01
ウェブサイト「(Rで)塩基配列解析」は、主に塩基配列データや遺伝子発現データ解析をフリーソフトウェアRで効率的に行うための包括的な情報サイトである。本研究は、ウェブサイト (Rで)塩基配列解析の安定的な提供を目指し、①情報更新および②情報拡充を行うことを目的としている。今年度も昨年度に引き続き、文言の表記ゆれやリンク切れの修正、新規項目や最新プログラムおよび原著論文の追加といった地味な作業を中心に行った。特にsingle-cell RNA-seq (scRNA-seq)解析関連の項目を重点的に追加したが、この過程でこれまでbulk RNA-seqの論文中で報告済みのいくつかの事柄が無視されていることに気づいた。具体的には、「bulk RNA-seq用に開発された"有名な"データ正規化法」を「発現変動遺伝子数やその群間での偏りが非常に大きいscRNA-seq用に開発されたデータ正規化法」と比較し、後者のほうがよいと結論付ける高インパクト論文を発見した。一見まともそうなロジックに思えるが、実際には「発現変動遺伝子数やその群間での偏りが非常に大きい場合にも対応可能なbulk RNA-seq用の頑健なデータ正規化法」は存在する(がそれとの比較がなされていない)。また、scRNA-seqをbulk RNA-seqと区別する大きな特徴として、ゼロカウントのデータの多さ(ゼロ過剰)もしばしば強調されている。しかしながら、おそらく最初にゼロ過剰の特徴について報告がなされたのは、2013年のbulk RNA-seq用カウントデータモデル論文である可能性が高い。これらの調べた限りの事実関係を論文にまとめた(投稿中)。他には、多群間比較時に発現変動パターンの同定まで行う場合のガイドラインに関する要望が寄せられていたため、推奨解析ガイドライン論文を公開した(Osabeら, 2019)。