构建数据库(以番茄为例)
/data/public_92/gengxin/female_annotation/ncbi-blast-2.16.0+/bin/bmakeblastdb -in tomato_protein.fa -dbtype prot
比对
/data/public_92/gengxin/female_annotation/ncbi-blast-2.16.0+/bin/blastp -query PTG001781L.40.pep -db ITAG4.0_proteins.fasta -evalue 1e-5 -outfmt 6 -num_threads 30 -out /data/public_92/gengxin/1781/1781_tomato_blast_result.txt
提取命中的蛋白序列
cut -f2 1781_tomato_blast_result.txt | sort | uniq > 1781_tomato_ids.txt
seqkit grep -f tomato_ids.txt ITAG4.0_proteins.fasta > 1781_tomato_hits.fa
结果
1781_tomato_hits.fa文件中均为候选基因在番茄中的同源蛋白
原文链接:【金山文档 | WPS云文档】 候选基因在番茄中寻找同源蛋白
https://kdocs.cn/l/cmnBvO8UdTEn