【金山文档 | WPS云文档】 基于蛋白质结构做进化树的方法
https://www.kdocs.cn/l/cbjF6D4LMs3A
一、pdb文件获取
- 首先使用猫哥的esmfold_jiangchenhao:1.01镜像对蛋白质结构进行预测
- 注意:预测时应该首先检查蛋白质序列的fastq文件
如图片上的两个序列,以”.“结尾的在运行时会报错,以”*“或字母结尾的则会正常运行输出PDB文件
二、基于pdb文件使用NJ法或UPGMA法构建进化树
该文件下主要包括一个主程序structureTree1.py和script目录下基于NJ(base_nj.py)法或UPGMA(base_upgma.py)法构建的进化树的脚本,同时还包括一个配置文件config.ctl。
配置文件config.ctl内容
运行该脚本时执行命令如下图即可
####-t后可跟nj或者upgma选择不同建树方法
python structureTree1.py -c config.ctl -t nj