基因型似然值填补与分型方法(GLIMPSE,genotype likelihoods imputation and phasing method)的方法,用于利用现代参考面板对低覆盖度测序数据集进行单倍型分型和基因型填补。
该方法的输入是一个基因型似然值矩阵,定义在直接从测序读段获得的所有可变位置上。GLIMPSE使用吉布斯采样方案细化基因型似然值。在每次迭代中,估计每个个体的新单倍型对。这涉及两个主要步骤:(1)使用参考面板和所有其他目标单倍型的当前估计值进行单倍型选择;以及(2)基于李和斯蒂芬斯模型的线性时间采样算法。作为输出,GLIMPSE在每个可变位置产生基于共识的单倍型判定和基因型后验概率。
传统方法:需要将测序数据“变成”确定的基因型(如AA、AG、GG),这个过程在低深度时容易出错。
GLIMPSE:直接使用测序 reads 比对到参考基因组后计算出的基因型似然值矩阵作为输入。基因型似然值反映了在 observed reads 下,某种真实基因型的概率。
参考代码:
bcftools mpileup -f /home/Tg_genome/Tgradis.fa -I -q 20 -Q 20 Y41003CK5.sort.markdup.bam \
| bcftools call -mv -O z -o Y41003CK5_GL_new.vcf.gz