【金山文档 | WPS云文档】 当你需要进行蛋白序列比对与二级结构预测,在本地该怎么做? https://www.kdocs.cn/l/clP6Fl9Aeleg
当你恰好有一批蛋白序列文件(.pep .fasta),又恰好需要对其进行序列比对,再对其二级结构进行预测,在本地你需要怎么做?
一、首先需要从SWISS-MODEL获得拟比对蛋白的同源蛋白PDB文件和蛋白序列文件
- 进入SWISS-MODEL网站,点击Start Modelling,在下左图红框处直接粘贴1个蛋白序列然后Search For Templates,网站会进入右图状态寻找相似蛋白,这一过程会持续几分钟。
👋
注意:网站不认ID也不认符号(如*),疑似也不支持多条序列一起匹配,所以不建议直接上传fasta文件,会出现找不到匹配模版的情况,就直接粘贴序列文本吧
- 匹配结果出来后,选择匹配值最高的一个蛋白,下载其PDB文件和序列文件。
网站里不能提供所有的蛋白文件下载,没有的用PDB号去在PDB数据库(https://www.rcsb.org/)下载。
二、使用ClustalX进行第一步比对
把对照蛋白序列和目标蛋白序列合并成一个文件,跑ClustalX的Complete Alignment,需要的是结果文件里的.aln文件。
三、使用ESPript网站进行二级结构预测
- 进入ESPript 3.2,上传对照蛋白的.pdb和上一步的.aln。
- 不出意外的话,必然报错,在报错界面的Defining groups手动调整对照蛋白的序列号到第一位。
(如果对其他蛋白的排列顺序有要求,也可以在这里调整。)
👋
报错建议:1.把防广告的网页插件关掉,网站运行需要跳弹窗,或者管你要权限就给。
2.不能自动识别对照序列,需要手动调整顺序。
3.得到带二级结构预测的蛋白质比对文件。