以下使用香榧的TPS家族进行分型示范。软件用到的是【Tbtools】和【MEGA】。
一、准备香榧的蛋白质序列
这里使用的是ba版的蛋白质文件,路径为/data2/liyupeng/alice/output/female_anno/rename_fa_gff3/extract/female_mark1_protein.fa
二、p450基因家族的鉴定
基于 HMMER 的隐马尔可夫模型搜索
1、找到TPS家族的 HMM 模型
(1)先去interpro官网下载隐马可夫模型的全部模型数据加载下来Pfam-A models。网址:https://www.ebi.ac.uk/interpro/download/Pfam/
(2)从interpro数据库中获取 TPS家族的 HMM 模型(PF01397、PF03936、PF05860)。
在interpro数据库中的search > bytext中输入TPS,在结果中找到pfam号,要注意筛选。
(3)找到pfam号之后,新建一个pfamid.txt,把PF00067,输入进入。
2、打开TBtools,在others > Simple HMM Search中根据对应的要求,输入蛋白质文件和pfam号,点击start,成功会有congratulations,得到TBtools.SimpleHMM.Result.xls文件。

(1)TBtools.SimpleHMM.Result.xls文件里面有两个表,# Sequence scores(全长的打分)和# Domain scores(保守结构域区域的打分),我们只需要第一个表的id。
由于表格中的所有数据都在一列中,可以对表格进行分列处理,得到第一列的id号。可以选定一个标准。evalue<e的负10次方来筛选,xlxs表里面是4.54e-05。n的意思就是有几个结构域
获得了id后之后我们再通过蛋白质文件把这些蛋白质序列提取出来进行多序列比对和进化树分析。