By liyupeng, 29 December, 2025
Forums

GlimmerHMM预测

介绍

GlimmerHMM 是基于广义隐马尔可夫模型(GHMM)的新型基因预测工具。虽然该基因预测工具遵循 GHMM 的总体数学框架,但它额外引入了来自 GeneSplicer 程序的剪接位点模型和来自 GlimmerM 的决策树。它还利用了插值马尔可夫模型(Interpolated Markov Models,IMM)来处理编码区和非编码区的模型。

官网:GlimmerHMM

安装

  1. conda安装
    1. conda安装的没有物种参数模型,这个需要另外下载
    2. glimmer提供的物种模型主要是几种线虫和菌,还有一个阿拉伯芥(拟南芥)
conda install glimmerhmm -y
  1. github上克隆下来
    1. github上的文件自带物种参数,植物的话,可以使用训练好的拟南芥物种模型
 wget https://ccb.jhu.edu/software/glimmerhmm/dl/GlimmerHMM-3.0.4.tar.gz
tar -xzvf GlimmerHMM-3.0.4.tar.gz

使用

  1. 使用拟南芥物种模型进行预测
    1. g,gff输出格式
    2. n,指定输出多少份预测结果(gff3文件),这里是3个。然后,一般选择maxim.GlimmerHMM.gff.1,这是最优的
nohup /home/soft/GlimmerHMM/bin/glimmerhmm_linux_x86_64 \
    ../maxim.fna.hard_na.masked \
    /home/soft/GlimmerHMM/trained_dir/arabidopsis \
    -g -n 3 -o maxim.GlimmerHMM.gff &

参考

  1. GitHub - mpertea/GlimmerHMM: Eukaryotic gene finding system using a Generalized Hidden Markov Model