By Gengxin, 19 July, 2025

构建数据库(以番茄为例)

/data/public_92/gengxin/female_annotation/ncbi-blast-2.16.0+/bin/bmakeblastdb -in tomato_protein.fa -dbtype prot

比对

/data/public_92/gengxin/female_annotation/ncbi-blast-2.16.0+/bin/blastp -query PTG001781L.40.pep -db ITAG4.0_proteins.fasta -evalue 1e-5 -outfmt 6 -num_threads 30 -out /data/public_92/gengxin/1781/1781_tomato_blast_result.txt

提取命中的蛋白序列

cut -f2 1781_tomato_blast_result.txt | sort | uniq > 1781_tomato_ids.txt
seqkit grep -f tomato_ids.txt ITAG4.0_proteins.fasta > 1781_tomato_hits.fa

结果

1781_tomato_hits.fa文件中均为候选基因在番茄中的同源蛋白

原文链接:【金山文档 | WPS云文档】 候选基因在番茄中寻找同源蛋白
https://kdocs.cn/l/cmnBvO8UdTEn