GlimmerHMM预测
介绍
GlimmerHMM 是基于广义隐马尔可夫模型(GHMM)的新型基因预测工具。虽然该基因预测工具遵循 GHMM 的总体数学框架,但它额外引入了来自 GeneSplicer 程序的剪接位点模型和来自 GlimmerM 的决策树。它还利用了插值马尔可夫模型(Interpolated Markov Models,IMM)来处理编码区和非编码区的模型。
官网:GlimmerHMM
安装
- conda安装
- conda安装的没有物种参数模型,这个需要另外下载
- glimmer提供的物种模型主要是几种线虫和菌,还有一个阿拉伯芥(拟南芥)
conda install glimmerhmm -y- github上克隆下来
- github上的文件自带物种参数,植物的话,可以使用训练好的拟南芥物种模型
wget https://ccb.jhu.edu/software/glimmerhmm/dl/GlimmerHMM-3.0.4.tar.gz
tar -xzvf GlimmerHMM-3.0.4.tar.gz使用
- 使用拟南芥物种模型进行预测
- g,gff输出格式
- n,指定输出多少份预测结果(gff3文件),这里是3个。然后,一般选择maxim.GlimmerHMM.gff.1,这是最优的
nohup /home/soft/GlimmerHMM/bin/glimmerhmm_linux_x86_64 \
../maxim.fna.hard_na.masked \
/home/soft/GlimmerHMM/trained_dir/arabidopsis \
-g -n 3 -o maxim.GlimmerHMM.gff &