- LD 衰减分析可以查看整个群体及亚群的连锁水平,推荐软件 popLDdecay。
- 如果两个座位在基因组上离得越近,连锁就越强,LD度越大。因此,随着标记见距离的增加,平均LD度将降低,呈现衰减状态,称之为LD衰减图。
- LD衰减距离:平均LD系数降低到一定标准后(降低到最大值的一半;降低到0.2以下;降低到0.1以下),对应的物理距离。影响因素:群体类型,野生vs驯化(野生比驯化衰减的更快);世代间隔(世代间隔短,重组概率高,LD连锁被打碎,R2值小,衰减更快);染色体相对位置。
- LD衰减距离的应用:GWAS中估计标记的覆盖度,通过LD衰减距离和标记间平均距离的比较判断标记是否足够;判断群体多样性的差异,一般野生群体的LD衰减速度快于驯化群体。
- 该分析需要使用未进行 LD 过滤的 VCF 文件。
1 整个群体的LDdecay分析
# 教程:https://zhuanlan.zhihu.com/p/431182680 https://zhuanlan.zhihu.com/p/109164405
# 示例代码
~/bin/PopLDdecay -InVCF file.vcf -OutStat LDdecay
# 利用perl脚本生成R脚本,下载到本地,绘图
perl /home/software/PopLDdecay-3.43/bin/Plot_OnePop.pl -inFile all_LDdecay.stat.gz -output all_LDdecay_plot
2 按种群划分的LD衰减分析
# (1)准备种群文件,如RB种群
[root@3eb13a5fb4e6 pop_sample]$head 01RB.txt
RB-5
RB-7
RB-2
RB-4
# (2)分种群进行分析,每个种群运行一次
/home/software/PopLDdecay-3.43/bin/PopLDdecay -InVCF file.vcf -SubPop 02GZ.txt -OutStat 02GZ_pop_LDdecay
/home/software/PopLDdecay-3.43/bin/PopLDdecay -InVCF file.vcf -SubPop 03PN.txt -OutStat 03PN_pop_LDdecay
# (3)多个亚群共同绘图
## 新建文件夹LD_allresults,复制所有结果到该目录下
### 准备配置文件(提取 文件名称作为第一列,群体名称作为第二列)
ls *.stat.gz | awk -F'[_.]' '{print $0 "\t" substr($1,3)}' > ld_stat.list
### 配置文件内容如下
[root@3eb13a5fb4e6 LD_allresults]$cat ld_stat.list
01RB_pop_LDdecay.stat.gz RB
02GZ_pop_LDdecay.stat.gz GZ
03PN_pop_LDdecay.stat.gz PN
04MH_pop_LDdecay.stat.gz MH
## 多亚群LD绘图
perl /home/software/PopLDdecay-3.43/bin/Plot_MultiPop.pl -inList ld_stat.list -output ld_stat.multi -keepR