By masiyi, 27 October, 2023
Forums

1.在 JBrowse 中,各个文件类型对应的文件格式如下:

  • BED(Browser Extensible Data):使用文本文件(通常是以制表符分隔)表示基因组上的特征或注释信息,例如基因、位点等。可以用于创建基因组注释跟踪(Annotation tracks)、基因结构跟踪(Gene structure tracks)和其他特征跟踪(Feature tracks)。

  • GBK(GenBank):使用 GenBank 文件格式来存储生物学序列、特征和相关注释信息的文件,一般用于存储完整的基因组序列和预测的基因组注释信息。主要用于创建基因组注释跟踪,以显示完整的基因组序列和注释信息。

  • BAM(Binary Alignment/Map):二进制比对/映射文件,主要用于存储DNA或RNA序列与参考基因组的比对结果,包括序列读取在基因组上的位置、碱基质量得分等信息。通常用于比对/映射跟踪(Alignment tracks),用来显示 DNA 或 RNA 序列与参考基因组之间的比对结果。

  • CRAM(Compressed BAM):压缩的二进制比对/映射文件,类似于BAM文件,但使用了更高效的压缩算法,可以减小文件的存储空间占用。

  • VCF(Variant Call Format):变异调用格式文件,用于存储关于个体或样本的基因组变异数据,如单核苷酸变异(SNV)、插入缺失(Indel)等。用于变异调用跟踪(Variant calling tracks),用来显示基因组中的变异位点和相关信息。

  • BW(BigWig):一种用于存储和展示基因组上数值型信号数据(如测序深度、甲基化水平等)的文件格式。用于数值型信号跟踪(Signal tracks),例如基因组测序深度、表观遗传学修饰水平等。

PS:需要注意的是,这些文件类型只是用来描述数据的格式和内容,并不一定代表对应的文件扩展名。同一个文件类型可以有多种不同的文件扩展名,具体使用哪个扩展名取决于实际情况和数据处理软件的要求。

2.除去Alignment(比对轨道)、HTML features和Canvas features三种基本轨道外其它支持的轨道需要的数据(也可以说是除了基础轨道外的扩展轨道类型)

HTMLVariants(变异轨道)需要使用如VCF(Variant Call Format)文件中的变异记录作为数据源来在HTMLVariants轨道中呈现相关的变异信息。和XYPlot(XY轨道):XYPlot轨道用于绘制柱状图或折线图等二维数据。与.fa文件不同,XYPlot轨道一般使用其他格式的数据集,如JSON或TSV(制表符分隔值)文件,作为数据输入。需要准备包含有效数据点的输入文件,并根据该文件的格式和字段配置XYPlot轨道。

3.定制轨道(以BAM文件为例)

1)使用相关工具处理成JBrowse所支持的文件后,放入JBrowse下的目录中并给予合适的读写权限;

2)在JBrowse的配置文件(一般是jbrowse.conf文件)中添加BAM轨道的相关信息,并添加以下配置内容:

其中UrlTemplate和baiUrlTemplate分别是上传BAM和BAI文件的路径;key是标识符用于区分不同的轨道;label填入想要显示在轨道上的标签;type是选择轨道类型

            
            "baiUrlTemplate": "bam/pame.hifi.bam.bai",
            "key": "hifi_bam",
            "label": "hifi_bam",
            "storeClass": "JBrowse/Store/SeqFeature/BAM",
            "type": "JBrowse/View/Track/Alignments2",
            "urlTemplate": "bam/pame.hifi.bam"