2 研究意义
GWAS的发展,带动了对相应的统计分析方法的研究和相关统计软件的开发。但是目前GWAS中的数据分析手段仍然落后于实际需求。一方面,目前人类遗传学中的关联分析方法均为单标记分析,即一次只分析一个基因标记,而忽略了基因之间的联系。由于致病机制的复杂性,基于基因一基因交互作用、基因一环境交互作用的分析,特别是高阶相互作用、交互作用的分析是今后研究的重点,而基于单个SNP的分析显然不能满足实际需要。另一方面,数量性状的上位性检测以及海量基因标记的出现,导致遗传模型中的样本容量远小于变量的个数,这使得目前GWAS中采用的传统参数估计方法不再适用。而且,面对几十万个变量,目前的计算机系统很难胜任高阶交互作用的探索。因此,GWAS数据的深入探索和分析还需要新的分析思路、方法和手段。
弹性网方法不仅能发挥自变量的分组效应,还能在样本容量远小于自变量的个数时有效进行变量选择,预测精度也较高。因此考虑将弹性网方法应用于GWAS的统计分析过程中,如果能验证其结果准确度和精度较高,则基于弹性网方法的GWAS是可行的,将为GWAS的研究带来便利。 基于弹性网方法的全基因组关联分析+源代码+答辩PPT(3):http://www.youerw.com/jisuanji/lunwen_37901.html