著者
菅澤 翔之助
出版者
一般社団法人 日本統計学会
雑誌
日本統計学会誌 (ISSN:03895602)
巻号頁・発行日
vol.51, no.2, pp.295-317, 2022-03-03 (Released:2022-03-10)
参考文献数
31

ビッグデータ時代と称される現代では,様々な分野において大規模データの利活用が進んでいる. 一方で,データの大規模化と共に異質な集団が混在した状況が多く見受けられるようになり,従来の「1つのデータに1つのモデル(one-model-fits-the-whole-population approach)」による単純な統計モデリングだけでは適切な分析を実行することができない.このような状況にも対応できる様々な方法論が既にいくつか存在しているが,現実的な計算コストで柔軟な統計モデリングを実行できる方法論の開発は未だ十分とは言えない.本稿では,クラスターデータと空間データの解析において,データのグループ化(異質な集団の発見)と各グループにおける統計モデルの推定(各集団特有の構造の発見)を同時に実行することが可能な方法論について解説する.
著者
大谷 隆浩 菅澤 翔之助 野間 久史
出版者
日本計算機統計学会
雑誌
計算機統計学 (ISSN:09148930)
巻号頁・発行日
vol.31, no.1, pp.17-33, 2018 (Released:2019-02-27)
参考文献数
41

過去十数年の間に世界中で行われたゲノムワイド関連解析 (genome-wide association study; GWAS) の成果により, 様々な形質に関連する数千の一塩基多型 (single nucleotide polymorphism; SNP) が同定されている. これまでのGWASでは, 集団内におけるマイナーアレル頻度がある程度高いSNPを対象として研究が行われてきたが, 近年のDNAシークエンシング技術の飛躍的な発展に伴い, 頻度が極めて低い希少変異 (rare variant) に注目した研究が行われるようになっている. 統計学的な観点からも, 希少変異の関連解析は頻度が高いSNPの解析に比べてより困難となることから, GWASで一般的に採用されている単一のSNPによる単変量の関連解析ではなく, 注目する遺伝子やDNA領域内にある複数の変異の情報を集約した上で, 表現型との関連を検定する手法が提案されている. 本稿では, 近年の様々な方法論的研究で提案されている, 希少変異を対象とした関連解析手法のレビューを行う.