著者
松谷 太郎 宇恵野 雄貴 福永 津嵩 浜田 道昭
雑誌
研究報告バイオ情報学(BIO) (ISSN:21888590)
巻号頁・発行日
vol.2017-BIO-50, no.33, pp.1-6, 2017-06-16

がんゲノムの変異パターンと,その背景にある変異源の分布は変異シグネチャー (Mutation Signature : MS) と呼ばれ,本研究では機械学習の手法を用いてこれを明らかにする.MS の推定は発がんメカニズムの解明の後押しになるなど重要な課題であり,先行研究では非負値行列因子分解や混合メンバーシップモデルを使った学習が行われていたが,MS の数が予測困難である等の問題点がある.本研究では MS ごとの変異の生成過程に対して潜在的ディリクレ再配置 (LDA) と呼ばれるトピックモデルを採用し,サンプルごとの体細胞突然変異からその背後にある生成モデルを推定する.学習に変分ベイズ法を用いることで,変分下限から MS 数を予測することが可能となり,シミュレーションベースではその推定に成功した.また,COSMIC データベースを用いた実データ解析にも着手している.