因为香榧数据量较大,包含4亿多个snps,使用基于R包的GAPIT会需要很多时间以及资源,所以采用GCTA和GEMMA软件中的模型来进行关联分析。
一、GCTA关联分析
#批量添加亲缘关系和PCA
for f in /home/147_Tg_reseq/142_final_gwas_result/pheno_*.txt; do fname=$(basename "$f"); gcta64 --bfile /home/147_Tg_reseq/142_final_gwas_result/142samples_imputed_all_chr_final --grm /home/147_Tg_reseq/142_final_gwas_result/relatedness_matrix --pheno "$f" --qcovar /home/147_Tg_reseq/142_final_gwas_result/PCA_result.eigenvec --mlma --out GWAS_reseq_${fname%.txt} --thread-num 10; done二、gemma
速度很快,可以选择模型
#先生成亲缘关系
/bin/gemma-0.98.5-linux-static-AMD64 \
-bfile 142samples_imputed_all_chr_final \
-gk 1 \
-o gemma_142samples_imputed_all_chr_final_grm
##批量进行关联分析
for i in {2..35}; do
/bin/gemma-0.98.5-linux-static-AMD64 \
-bfile 142samples_imputed_all_chr_final \
-k /home/147_Tg_reseq/142_final_gwas_result/output/142samples_imputed_all_chr_final_qc_gemma_grm.cXX.txt \
-p pheno_${i}_clean.txt \
-lmm 4 \
-outdir ./gwas_reseq_gemma \
-o