著者
松井 茂之
出版者
日本計量生物学会
雑誌
計量生物学 (ISSN:09184430)
巻号頁・発行日
vol.38, no.2, pp.127-139, 2018-03-01 (Released:2018-05-18)
参考文献数
32

In this article, we discuss the role of P values in multiple testing to associate a large number of genetic or molecular features with a phenotypic variable of interest in biomedical omics studies. For multiple tests in such association analyses, we distinguish those conducted for confirmatory purpose, as seen in genome-wide association studies to determine disease-associated variants, from those for exploratory screening of associated features. For the latter, exploratory analysis, we discuss application of the ROC curve analysis used in diagnostic medicine, as an alternative, but more relevant framework, rather than the standard framework based on multiple testing that controls false positives only. Finally, partly based on arguments made in the field of omics studies, we make some comments on future endeavors by statisticians to disseminate discussions given in the ASA’s Statement on P-Values (Wasserstein and Lazar, 2016, The American Statistician, 70, 129-133) to improve statistical practice in various scientific fields.
著者
佐竹 哉太 山田 誠 松井 孝太 松井 茂之 鹿島 久嗣
出版者
人工知能学会
雑誌
2019年度 人工知能学会全国大会(第33回)
巻号頁・発行日
2019-04-08

生存時間分析はイベントが発生するまでの時間を分析するための手法であり、多くの分野で使用されている。 この生存時間分析の中で最も良く用いられるモデルとして、Cox比例ハザードモデルがある。Cox比例ハザードモデルはイベントの詳細な分布が分からない場合でも利用でき、また線形式の係数により特徴の重要性を解釈することができる。しかし一方で特徴の線形な関係性しか利用できないという問題がある。非線形なCoxモデルも研究されているが、それらのモデルでは解釈ができない欠点がある。本研究では、CoxハザードモデルにFactorization Machines (FM)を導入したモデルを提案する。このモデルでは共変量間の相互作用を利用でき、また解釈も可能である。提案手法の性能を評価するため、実際の遺伝子データから特徴選択を行い、それによって選択された特徴を用いて実験を行った。その結果、提案手法が既存手法に比べ良い性能を示すことを確認した。