金山文档链接:【金山文档 | WPS云文档】 Mixed染色体的构建和Mapping
https://www.kdocs.cn/l/cde205mwZdek
声明
此方法恐怕有计算上的错误。
NC_Chr10_ZW_mixed染色体的构建
背景
这是57个群体个体的重测序数据
这个峰的区间是338350001-1697390000
鉴于Chr10上极为显著的信号,考虑做一个ZW+Nc-这段区间的 的参考基因组
方法如下,
第一步,我们根据基因组比对的结果( Nc比单倍型) 找到这段区间在染色体上的对应位置
cd /data3/jiangchenhao/Hap_genome_jch_rename/Chr_split/Nc_to_hap/Chr10_vs_Fe_hap1_Chr10
有Chr10_vs_Fe_hap1_Chr10syri.vcf文件
(rna_seq_call_snp) [jiangchenhao@localhost Chr10_vs_Fe_hap1_Chr10]$ awk -F'\t' '$1=="Chr10" && $2>=338000000' Chr10_vs_Fe_hap1_Chr10syri.vcf |head
Chr10 338000030 SNP3168577 C T . PASS END=338000030;ChrB=Fe_hap1_Chr10;StartB=352197932;EndB=352197932;Parent=SYN157;VarType=ShV;DupType=. GT 1
所以female_hap1的起始是352991852,终止是1669849011,完整区间是[352991852,1669849011]
female_hap2的起始是330959080,终止是1672531356,完整区间是[330959080,1672531356]第二步,我们根据位置用samtools切片单倍型对应染色体,得到SDR1,SDR2
第三步,我们切片Chr10上的0-338350001和1697390000-end, 去掉原来的Chr10
把以上合并,形成NC_Chr10_ZW_mixed.fa
以上均以完成。
分染色体文件构建完成。
准备核型分析。这里要加一个过滤次要比对的命令
已经加了过滤次要比对的命令,开工了开工了。
输入数据是1G的重测序数据。
bwa_map_and_ky.py -t 30 -r /project1/data1/genome_data/genome/hap_chr_gff3/NC_Chr10_ZW_mixed/NC_Chr10_ZW_mixed.fa -i /project1/data1/Tg_down_sample2/index_file.txt -l /project1/data1/genome_data/genome/hap_chr_gff3/NC_Chr10_ZW_mixed/NC_Chr10_ZW_mixed_Chr_len.txt -c /project1/data1/genome_data/genome/hap_chr_gff3/NC_Chr10_ZW_mixed/chr_split/ -o /project1/data1/genome_data/genome/hap_chr_gff3/NC_Chr10_ZW_mixed/output/bwa_map_and_ky.py -t 30 \
-r /project1/data1/genome_data/genome/hap_chr_gff3/NC_Chr10_ZW_mixed/NC_Chr10_ZW_mixed_fixed.fa \
-i /project1/data1/Tg_down_sample2/sample.txt \
-l /project1/data1/genome_data/genome/hap_chr_gff3/NC_Chr10_ZW_mixed/chr_len \
-c /project1/data1/genome_data/genome/hap_chr_gff3/NC_Chr10_ZW_mixed/chr_split/ \
-o /project1/data1/genome_data/genome/hap_chr_gff3/NC_Chr10_ZW_mixed/output/ NC_Chr10_ZW_mixed_version2染色体的构建
这次我把区间选的小一点,定性为Nc的338MB-360MB
所以female_hap1的起始是352991852-374649605
所以female_hap2的起始是330959080-352720959
对的还挺齐的哈