郑天琦, 周菁, 李启寨
全基因组关联研究通常采用两阶段分析策略,两个阶段的结果相互验证,以减少混杂因素的干扰,从而有效地降低假关联比例.现有文献中关于两阶段分析主要针对单一疾病,尚未见对多个疾病的情况.针对多个疾病,文章提出了两种两阶段分析方法:独立分析与联合分析.针对两种方法的不同阶段,分别构建表型与单核苷酸多态性位点关联检验的二次型统计量.在零假设成立的条件下,构建的统计量与混合卡方随机变量加权和具有相同的渐近分布,并利用近似分布给出了检验的$p$-值.数值结果表明,两种方法在不同样本量和显著性水平下均表现出较高的统计功效,当次等位基因频率MAF (minor allele frequency)较小时,联合分析优于独立分析;而当MAF较大时,独立分析优于联合分析,同时随着MAF的增加,两种分析的功效都在增加.基于在小鼠基因型-表型关联研究中的实证结果显示,两种分析方法都能有效识别出48个具有显著关联的单核苷酸突变位点.