著者
草田 義昭 瀬尾 茂人 竹中 要一 野口 眞三郎 松田 秀雄
雑誌
研究報告バイオ情報学(BIO) (ISSN:21888590)
巻号頁・発行日
vol.2016-BIO-45, no.7, pp.1-6, 2016-03-11

遺伝子発現プロファイルの臨床応用は,近年精力的に研究が行われている.しかしマイクロアレイを用いたデータ解析においては,”バッチ効果” を取り除くことが不可欠であり,さらに逐次サンプルが追加される臨床現場では,1 サンプル毎に正規化が完結することが求められている.我々は,ノンパラメトリックZ標準化 (NPZ) 法を提案し,既存の手法と比較検討を行った.まず,公共のデータベースからエストロゲン受容体 (ER) とヒト上皮増殖因子受容体 2 (HER2) の免疫組織化学 (IHC) 染色の結果を有する 2,813 症例 (24 データセット) のマイクロアレイの発現データを抽出した.続いて,CEL ファイルからバックグランド補正及び,log2 変換のみを行ったもの (Raw), 既存の 4 つの正規化法 [Microarray Suite 5.0(MAS5),frozen robust multiarray analysis (fRMA),radius minimax (RMX)]. に対して,下記の 6 つの数値変換 [無変換,シングルアレイ数値変換(RANK,,Z,NPZ,,YuGene),マルチアレイ数値変換 (ComBat)] を加えて,各々の ER と HER2 の IHC 染色の結果と mRNA の発現の一致率を比較した.シングルアレイ数値変換を行うことで IHC 染色と mRNA の発現の一致率は改善した.一方で,マルチアレイ数値変換は,主成分分析ではバッチ効果を他の手法に比して除去しているように図示されたが,実際には IHC 染色との一致率が低下していた.さらに,乳癌の予後と数値変換の検討の結果,MAS5 後に NPZ を加えることで,無変換,マルチアレイ数値変換と比べて 2 群の差が明瞭となった.今回,我々は乳癌のデータセットを用いて数値変換の与える影響について検討を行った.シングルアレイ数値変換を追加することで,臨床における発現データのバッチ効果の除去に有効である可能性が示唆された.