关键词:连锁不平衡、有效群体大小、家系、标记密度、基因组选择
一、概念:
1、连锁不平衡:
连锁不平衡(Linkage Disequilibrium,LD)是群体遗传学和基因组学中的一个基本概念,用于描述两个或多个遗传标记(如单核苷酸多态性,SNP)之间的非随机关联。当某些SNP的等位基因组合在一个群体中出现的频率高于根据单独等位基因频率计算的预期频率时,就产生了连锁不平衡。
例如:假设在同一染色体两个位点 A 和 B,它们各有两个等位基因 A1,A2 和 B1,B2,可能形成 4 种单倍型(A1B1,A1B2,A2B1,A2B2)。如果 A 与 B 无LD:两个位点的等位基因相互独立,随机组合,概率为 A1B1:A1B2:A2B1:A2B2=0.25:0.25:0.25:0.25,AB 组成的频率:(等位基因频率)。如果 A 与 B 存在 LD:即 A 与 B 连锁,则概率会偏离 0.25。当处于完全连锁时,概率为 A1B1:A2B2=0.5:0.5,A1B1 组合的频率,D 表示两位点间 LD 程度)。
2、有效群体大小:
是指与实际群体具有相同基因频率方差或相同杂合度衰减率的理想群体含量。具体来说,如果一个实际群体的基因频率方差或杂合度衰减率与某个理想群体相同,那么这个理想群体的个体数量就是该实际群体的有效群体大小。
其中,基因频率会在世代间随机波动,这种现象被称为遗传漂变。基因频率方差的大小也间接反映了群体的遗传多样性。当基因频率方差较小时,说明基因频率相对稳定,群体中的等位基因分布较为均匀,遗传多样性较高。
杂合度衰减表示:在一个封闭的群体中,随着世代的延续,如果没有新的基因引入,杂合度会逐渐衰减,这主要是由于近亲繁殖导致的。有效群体大小越小,近亲繁殖的可能性就越大,杂合度衰减的速度也就越快。
杂合度衰减率还能帮助我们预测群体在未来世代中的遗传变化趋势。如果一个群体的杂合度衰减率较快,说明该群体的遗传多样性正在迅速丧失。
小结:
(1)LD 和有效群体大小,是数量遗传学、进化研究等领域的重要参数
(2)LD 能反映群体的遗传结构和历史;有效群体大小是衡量群体遗传多样性的重要指标。
3、基因组选择
基因组选择(Genomic Selection,GS)是一种通过基因组信息来预测育种材料(及其后代)表现的方法,从而达到育种选择的目的。
二、背景
基因组选择的决定因素与有效群体大小和标记密度相关;且基因组选择所需要的标记数的确定主要基于LD的发生,而LD的发生又由种群结构和有效群体大小决定。
然而LD并不是所有GS的主要驱动力,在具有较大基因组的物种的研究可能会发现,亲缘关系是影响预测准确性的重要因素。
有研究表明,使用全同胞家系时,GS预测精确度通常为中等到高。
该文章选择了两个针叶树物种,全同胞家系花旗松和半同胞家系室内云杉。
三、结果
1、随着标记数增加,两种针叶树种的GS预测准确性也随之增加。到达标记数的饱和点,预测的准确度几乎没有变化。
2、综合来看,花旗松GS预测准确度高于室内云杉,反映种群的全同胞和半同胞之间的差异。