关于运行GAPIT时基因型文件缺失报错，进行基因型文件填补

By Tingting, 28 June, 2024

Forums

进行关联分析中运行SUPER模型时出现报错如下：

#读取的数据有3个
myY <- read.table("260sample_styleL.txt", header = TRUE, sep = "\t")
myG <- read.table("combine_all.pass.recode.clear.hmp.txt", header = FALSE, sep = "\t")
myCV <- (read.table("Rp_CV_3.txt", header = TRUE, sep = "\t")) 
source("gapit_functions.txt")

错误表明，基因型文件出现缺失值

于是，检查基因型文件

#在R中检查文件
any(is.na(myY))
[1] FALSE
any(is.na(myG))
[1] TRUE
any(is.na(myCV))
[1] FALSE
#以上结果表明，G文件中有缺失值
#接着，检查文件中缺失值以及缺失位置
sum(is.na(myG))
which(is.na(data), arr.ind = TRUE)`
#或者使用以下命令，打印检查结果
# 查看是否有缺失值
any_missing <- any(is.na(myG))
# 统计缺失值的数量
missing_count <- sum(is.na(myG))
# 查找缺失值的位置
missing_indices <- which(is.na(myG), arr.ind = TRUE)
# 输出结果
print(any_missing)
print(missing_count)
print(missing_indices)
#结果如下

（中间省略）

表明，第6列的第2行到第50000行存在缺失。

检查文件，发现基因型文件第六列是组装信息

GAPIT官方文档示例文件：

根据论文，填补组装信息。

基因组组装文章：《The draft genome assembly of Rhododendron delavayi Franch. var. delavayi》

问题：在否在assembly那一列补充Platanus v.1.2.4后，文件是可以读取的？？

图片看不到。