1. 准备文件
基因组文件及索引文件、基因组注释文件、转录组数据比对到基因组上的bam文件及索引文件、某个基因的CDS序列比对到基因组的bam文件及索引文件
samtools faidx -i Tgrandis.fa#基因组文件后见索引
#CDS序列构建比对基因组及构建索引
hisat2 -p 50 -x genome -f cds.fasta -S cds_vs_genome.sam #构建CDS的sam文件
samtools view -bS cds_vs_genome.sam > cds_vs_genome.bam #生成bam文件
samtools sort cds_vs_genome.bam -o cds_vs_genome.sort.bam #排序
samtools index -@ 4 cds_vs_genome.bam#bam文件构建索引,生成默认BAI索引,-@指定线程数
#转录组序列比对基因组及构建索引
使用华东师兄的转录组流程进行转录组分析,在mapping文件夹中找到最后生成的bam文件
samtools sort 001T0005_good.bam -o 001T0005_good.sort.bam #sort排序
samtools index -c -@ 4 001T0005_good.sort.bam#构建索引,生成CSI索引(支持超长序列)2. IGV可视化
3. 比对结果
结论:由于该基因注释缺少一段序列所以注释到的序列没有终止密码子