Description
工作流程发布,不足交流探讨及改进
工作流程发布,不足交流探讨及改进
因为香榧数据量较大,包含4亿多个snps,使用基于R包的GAPIT会需要很多时间以及资源,所以采用GCTA和GEMMA软件中的模型来进行关联分析。
一、GCTA关联分析
#批量添加亲缘关系和PCA
for f in /home/147_Tg_reseq/142_final_gwas_result/pheno_*.txt; do fname=$(basename "$f"); gcta64 --bfile /home/147_Tg_reseq/142_final_gwas_result/142samples_imputed_all_chr_final --grm /home/147_Tg_reseq/142_final_gwas_result/relatedness_matrix --pheno "$f" --qcovar /home/147_Tg_reseq/142_final_gwas_result/PCA_result.eigenvec --mlma --out GWAS_reseq_${fname%.txt} --thread-num 10; done二、gemma
速度很快,可以选择模型
首先,这个R包使用起来比较方便,但是安装较难。
一、软件安装
#conda下载4.4.3的R
#安装步骤
install.packages("BiocManager")
BiocManager::install(c("Biostrings", "GenomicRanges", "muscle", "IRanges", "rtracklayer", "trackViewer"))
install.packages("geneHapR")
#如果出现报错,则用conda安装依赖包,安装完依赖包,使用以下命令进行安装
#安装genehapR
devtools::install_git("https://gitee.com/zhangrenl/genehapr")PS: genehapR也有镜像,但是下载不了
二、分析基因的单倍型