基本介绍
- IGV-GSAman是一个基于IGV软件再开发的用于基因结构矫正的工具,作者是开发TBtools的那位,其他的基因结构矫正的工具还有apollo、artemis什么的(没有用过https://www.kdocs.cn/l/cu2zstkfaonA?kmonFrom=k_Mine_FileList&from=kdocs_pc_web&startTime=1774941892465&traceparent=00-4813e8395d70c20c373668b5222e69ca-454856fe93374d64-01-10),但听说作者本人的使用经历,似乎并不是特别好用。
- IGV-GSAman使用起来比较简单,功能也有很多,支持基因(这里应该是转录本)的合并、分割、增减外显子、重命名、添加或删除,图片保存、修改后的注释导出,cds序列的预测、异常外显子检测.......
安装方式
从github上下载,安装到电脑上就可以了
下载链接:Releases · CJ-Chen/GSAman
因为名字里面也有IGV,操作页面也几乎一样,所以很容易把IGV和IGV-GSAman搞混,这里放一个链接
使用方法
数据的准备
数据的话,提供基因组序列、配套的注释文件,以及基因组序列和转录组比对的文件(bam,sam?)就可以操作了
比对数据,可以参考这里的https://www.kdocs.cn/l/caE41kwA97SB(基于RNA-seq注释的比对过程),获得bam文件就可以了
然后就是使用前,需要对bam文件建立索引
samtools index -c Chr2.bam操作方法
- 数据导入,基因组文件时从左上角genome的按钮导入,注释文件和转录组测序数据和基因组序列的比对文件则是通过左上角file里面进行导入
- 这里一共有4类,第一个track,最上层,则是染色体序列的定位用的框,选择红色的那个浮标一样的东西拖拽,可以实现在基因组序列上的快速移动(几乎用不到);右上角的加号和减号合并的那一部分是控制显示区域的放大缩小;左上角可以选择操作的染色体,如果知道基因的名称或者染色体的坐标,可以直接输入快速跳转位置
- 第二类track,一共包含三个框,从上到下分别是覆盖度、剪切位点和实际的比对情况,差不多是这样。最上面的框用于显示该序列区域比对到的转录组数据的数量,比对的越多,这里的覆盖度也越高;、
- 第二个框是剪切位点,这个在较大范围(一个基因整体层面来看,而不是部分区域)来看比较清楚,用于分割外显子和内含子,和第一个框类似,比对的越多,线条越密。蓝色的代表负链上的剪切,红色的代表正链上的剪切。以上一张图为例,蓝色的区域(或红色区域)代表的是基因内含子区域,这些剪切线条的间隔区域则是外显子区域。
- 第三个框是转录组测序数据和基因组序列的实际比对情况,灰色的方框成片连起来可以看做是外显子区域,蓝色线条是内含子区域;至于其他颜色的方框,什么倒位、插入......各种类型的很多,基本上至看灰色的就行了。
- 因为比对的数据量较大,这么一个框不能完全显示,所以可以切换到另一种模式(squished)下,看的更加全面,不过要看细节的话还是选择collapased比较好,expanded太占位子了,我基本不用
- 接下来是第三类track,这是实际对注释的基因结构进行修改的一个框,按住alt,通过鼠标可以拖拽外显子的长度范围,并进行增减、分割、合并等。
- 这里,要想修改注释文件中的基因结构,导入的时候要选择gsman模式,一般模式下是无法进行编辑的
- 蓝色的是负链上的基因,金色的是正链上的基因,默认是这样,可以自行定义
- 最常用的功能应该是alt键位,加上鼠标左键拖拽外显子区域调整基因结构(或者增加、删减),然后重新预测cds区域,默认最长;大多数时候都可以,有的时候要结合正反链信息,预测正链的还是负链上的cds序列
- 异常外显子检测,像这样出现AG?之类的字符就是异常外显子,放大后,拖拽到蓝色和灰色区域(外显子和内含子)的边界,大多数时候可以解决;不过,有的时候还要考虑正负链信息,有的时候怎么拖拽都是还是存在这类警示信息,可能是这个转录本结构本身就是错误的,原因很多
- 异常cds结构检测。缺少起始密码子或者终止密码子之类之类的,就会出现类似下图的报错,这里是缺失终止密码子;这个时候,调整外显子边界,和上一个track的比对数据对齐,然后重新预测一遍cds序列就可以了
- 数据的导出;编辑完基因结构后,可以导出gff3文件
- 这个得经常导出才行,之前有一次不知道按了哪一个键位,之前编辑过的几百个基因全部重置了
- 导出后的文件,编辑过的,在第二列来源会改成gsaman,还有这里没有了基因,所有都是以转录本的形式进行记录,使用的时候可能还需要找个脚本重新转换一下
- 文件最下方的是新增的转录本,则是手动添加的