【金山文档 | WPS云文档】 当你需要计算蛋白氨基酸多态性值,在本地需要怎么做?
https://www.kdocs.cn/l/cuqYErn0xrh9
当你恰好有同源蛋白质氨基酸序列文件(xxx.pep),又恰好需要计算这些序列的多态性值进行比对分析,在本地你需要怎么做?
本次处理需要用到的软件是MEGA12。
一、首先得先用MEGA对文件进行序列比对
1.打开 MEGA 软件。
2.点击菜单:
Align → Edit/Build Alignment → Create a New Alignment → OK→选择Protein
(因为我们这里处理的是蛋白文件)。
3.点击 Edit → Insert Sequences from File...,导入FASTA 文件。
4.在进行比对前先删除空白行(创建比对的时候就是会自带一行叫“Sequence 1”)
5.所有序列导入后,点击菜单:Alignment → Align by MUSCLE→问你要不要选择全部序列,就OK→所有参数默认,点OK。
6.等待比对完成,然后点击Data → Export Alignment → MEGA format→保存为一个 .meg 文件。
7.会让你设置一个Title,没啥必要直接x掉。
二、计算蛋白多态性值
1.上一个步骤保存好文件就关掉,回到MEGA软件首页
2.Analysis → Distance → Compute Overall Mean Distance
3.参数设置
model/method → p-distance
Variance Estimation Method → 若只关心多态性值,选None即可;若想要误差,选Bootstrap method,这里我选择None
Gaps/Missing Data → Pairwise deletion
4.计算出值截图保存,并记录在表格中