在完成GWAS后,除了得到QQ-plot和曼哈顿图之外,还需要确定以下几个核心要素来对不同模型的结果进行评估,选择出最适模型:
① LDSC Intercept(LD Score regression Intercept)
功能:主要用于区分“真实遗传信号”与“群体分层偏差”。
原理:LDSC 利用了“连锁不平衡(LD)越强的位点,其关联信号倾向于越强”的原理。
② 曼哈顿图的“塔尖”形态
经验判定:最佳模型生成的曼哈顿图中,显著位点(塔尖)应该是清晰、聚拢且连续的(由 LD 导致)。
异常判定:如果图中到处都是零星散落的高点,或者整条染色体都莫名抬升,说明模型未能很好地处理背景噪音。
③ 显著位点的重合度与效应量(Effect Size)稳定性
模型比对:在不同模型下跑出的 Top SNPs。
经验选择:如果某个模型让已知的阳性对照基因(Positive Controls)变得更显著,且 λGC 维持在合理范围,通常认为该模型更优。