【金山文档 | WPS云文档】 Nc雌树和现在的细榧的关系是否为无性系?(此文档会持续更新)
背景
做这件事的目的是为了搞清楚标题所说的Nc雌树和现在细榧这个品种,尤其是我们潘母岗在30比30样本中找到的10个无性系是否是同一个,如果他这个树确实是现在这些树的同一个无性系,那么我设计杂合易位-半不育-致死的课题就容易多了。
数据下载
服务器上没有找到二代的reads,最终是从这个link上下载的数据:
这个压缩后数据量有75GB,压缩前估计150GB。
测序雌树做SNP Calling
nohup /home/zhanglab/install/cmd/slcx /HDD2/Pop_to_Fe_hap1/Nc_150.sorted.dedup.bam -e GVcF --keep-split --minimum-mapping-quality 30 -R /HDD2/TG_male_hap1_gpu_index/TG_male_hap1_fixed_Chr.fa -o Nc_150.gvcf.gznohup /home/zhanglab/install/cmd/slmgvcf_gpu_t F2_M_hap1.gvcf.gz Nc_150.gvcf.gz -g NC_and_F2.gz &
nohup /home/zhanglab/install/cmd/slmgvcf_gpu_t F4_M_hap1.gvcf.gz Nc_150.gvcf.gz -g NC_and_F4.gz &好了,这个输出文件才16GB,我很快就用bcftools算一下亲源性了。
如果确实是99,那么这个问题就解决了。
nohup bcftools view -v snps -m2 -M2 NC_and_F2.gz \
-e 'QD<2.0 || FS>60.0 || MQ<40.0 || MQRankSum<-12.5 || SOR>3.0 || ReadPosRankSum<-8.0 || QUAL<30.0' \
-Oz -o NC_and_F2.gz_highqual_biallelic_snps.vcf.gz --threads 16 &
nohup bcftools view -v snps -m2 -M2 NC_and_F4.gz \
-e 'QD<2.0 || FS>60.0 || MQ<40.0 || MQRankSum<-12.5 || SOR>3.0 || ReadPosRankSum<-8.0 || QUAL<30.0' \
-Oz -o NC_and_F4.gz_highqual_biallelic_snps.vcf.gz --threads 16 &nohup vcftools --gzvcf merge63.female.vcf.gz --out merge63_female_kinship2 --relatedness2千年香榧和F2(细榧那一片无性系中相似度较差的那个)的相似度是0.33,大概对应亲本和子代之间的相似度。
有可能是我选的比较对象不对,我可能把无性系整个踢掉了,保留下来的都是无性系的子代。所以可以再选一个个体进行SNP Calling
那么,就选择F28,这个样本数据量偏低,跑起来快。