By jiangchenhao, 31 January, 2026
Forums

金山文档链接:【金山文档 | WPS云文档】 Mixed染色体的构建和Mapping
https://www.kdocs.cn/l/cde205mwZdek

声明

此方法恐怕有计算上的错误。

NC_Chr10_ZW_mixed染色体的构建

背景

这是57个群体个体的重测序数据

这个峰的区间是338350001-1697390000

鉴于Chr10上极为显著的信号,考虑做一个ZW+Nc-这段区间的 的参考基因组

方法如下,

第一步,我们根据基因组比对的结果( Nc比单倍型) 找到这段区间在染色体上的对应位置

cd /data3/jiangchenhao/Hap_genome_jch_rename/Chr_split/Nc_to_hap/Chr10_vs_Fe_hap1_Chr10
有Chr10_vs_Fe_hap1_Chr10syri.vcf文件
(rna_seq_call_snp) [jiangchenhao@localhost Chr10_vs_Fe_hap1_Chr10]$ awk -F'\t' '$1=="Chr10" && $2>=338000000' Chr10_vs_Fe_hap1_Chr10syri.vcf |head
Chr10    338000030    SNP3168577    C    T    .    PASS    END=338000030;ChrB=Fe_hap1_Chr10;StartB=352197932;EndB=352197932;Parent=SYN157;VarType=ShV;DupType=.    GT    1
所以female_hap1的起始是352991852,终止是1669849011,完整区间是[352991852,1669849011]
female_hap2的起始是330959080,终止是1672531356,完整区间是[330959080,1672531356]

第二步,我们根据位置用samtools切片单倍型对应染色体,得到SDR1,SDR2

第三步,我们切片Chr10上的0-338350001和1697390000-end, 去掉原来的Chr10

把以上合并,形成NC_Chr10_ZW_mixed.fa

以上均以完成。

分染色体文件构建完成。

准备核型分析。这里要加一个过滤次要比对的命令

已经加了过滤次要比对的命令,开工了开工了。

输入数据是1G的重测序数据。

bwa_map_and_ky.py -t 30 -r /project1/data1/genome_data/genome/hap_chr_gff3/NC_Chr10_ZW_mixed/NC_Chr10_ZW_mixed.fa -i /project1/data1/Tg_down_sample2/index_file.txt -l /project1/data1/genome_data/genome/hap_chr_gff3/NC_Chr10_ZW_mixed/NC_Chr10_ZW_mixed_Chr_len.txt -c /project1/data1/genome_data/genome/hap_chr_gff3/NC_Chr10_ZW_mixed/chr_split/ -o /project1/data1/genome_data/genome/hap_chr_gff3/NC_Chr10_ZW_mixed/output/
bwa_map_and_ky.py -t 30 \
-r /project1/data1/genome_data/genome/hap_chr_gff3/NC_Chr10_ZW_mixed/NC_Chr10_ZW_mixed_fixed.fa \
-i /project1/data1/Tg_down_sample2/sample.txt \
-l /project1/data1/genome_data/genome/hap_chr_gff3/NC_Chr10_ZW_mixed/chr_len \
-c /project1/data1/genome_data/genome/hap_chr_gff3/NC_Chr10_ZW_mixed/chr_split/ \
-o /project1/data1/genome_data/genome/hap_chr_gff3/NC_Chr10_ZW_mixed/output/ 

NC_Chr10_ZW_mixed_version2染色体的构建

这次我把区间选的小一点,定性为Nc的338MB-360MB

所以female_hap1的起始是352991852-374649605
所以female_hap2的起始是330959080-352720959
对的还挺齐的哈