Description

工作流程发布,不足交流探讨及改进

By chenyi, 14 May, 2024
Forums
  1. info文件必须被放置在你的主题文件夹的根目录下,在我们这个例子中就应该是在nowicode
By Tingting, 14 May, 2024
Forums

所需文件:vcf文件

使用到的软件vcftools、plink、admixture

#vcftool、plink软件通过压缩包下载安装

#使用vcftools转化为plink格式

vcftools --vcf sample.vcf --plink --out sample_plink

#使用plink生成bed文件

plink --file sample_plink --make-bed --out sample_bed

#使用conda下载admixture

conda install admixture

#运行admixture

By masiyi, 11 May, 2024
Forums

本模块依然在91的师姐的rhoddb-test容器中进行测试

一、模块的下载和安装

在GitHub上面通过链接下载或者下载压缩包到本地(https://github.com/tripal/tripal_synview/blob/master/README.md)

二、所需数据收集和前期处理

1.数据收集

这里测试以RPGD上的马樱杜鹃V2版本的基因组fasta、注释gff3和蛋白序列fasta,圆叶杜鹃基因组fasta、注释gff和蛋白序列fasta为测试数据。均可在RPGD上下载。

2.数据处理

由于此模块是将最终计算的种内(种间)基因共线性区块结果给可视化了,所以还需要得到这个共线性结果。在这里我们使用MCScanX,也是从GitHub上可以下载。

2.1gff文件处理成所需格式

MCScanX需要gff文件和blast结果文件作为输入文件,由于它所需要的gff文件和标准gff文件不一样,所以我们需要先对gff文件进行处理(这里以马樱杜鹃的gff为例),提取它需要的列生成一个新的gff文件,在这里我们只要cds,首先先提取所有cds,命令如下: