进行关联分析中运行SUPER模型时出现报错如下:
#读取的数据有3个
myY <- read.table("260sample_styleL.txt", header = TRUE, sep = "\t")
myG <- read.table("combine_all.pass.recode.clear.hmp.txt", header = FALSE, sep = "\t")
myCV <- (read.table("Rp_CV_3.txt", header = TRUE, sep = "\t"))
source("gapit_functions.txt")
错误表明,基因型文件出现缺失值
于是,检查基因型文件
#在R中检查文件
any(is.na(myY))
[1] FALSE
any(is.na(myG))
[1] TRUE
any(is.na(myCV))
[1] FALSE
#以上结果表明,G文件中有缺失值
#接着,检查文件中缺失值以及缺失位置
sum(is.na(myG))
which(is.na(data), arr.ind = TRUE)`
#或者使用以下命令,打印检查结果
# 查看是否有缺失值
any_missing <- any(is.na(myG))
# 统计缺失值的数量
missing_count <- sum(is.na(myG))
# 查找缺失值的位置
missing_indices <- which(is.na(myG), arr.ind = TRUE)
# 输出结果
print(any_missing)
print(missing_count)
print(missing_indices)
#结果如下
(中间省略)
表明,第6列的第2行到第50000行存在缺失。
检查文件,发现基因型文件第六列是组装信息
GAPIT官方文档示例文件:
根据论文,填补组装信息。
基因组组装文章:《The draft genome assembly of Rhododendron delavayi Franch. var. delavayi》
问题:在否在assembly那一列补充Platanus v.1.2.4后,文件是可以读取的??
图片看不到。