背景
这个工作2022年发在Molecular Plant,有Xing Wang Deng院士挂面,问题不大。
标题是
Two haplotype-resolved, gap-free genome assemblies for Actinidia latifolia and Actinidia
chinensis shed light on the regulatory mechanisms of vitamin C and sucrose metabolism in kiwifruit。
也就是说,他组装了两个单倍型级别的参考基因组。
结果部分
DH与KY的差异表达等位基因
等位基因差异表达对生存和生长具有关键作用,可导致表型多样性与进化。为在全基因组水平鉴定果实发育过程中呈现等位基因特异性表达(ASE)的基因,本研究分别对DH(29套)和KY(30套)RNA-seq数据集(附表1、附图13)进行等位基因水平定量分析(方法部分)。
首先将转录组读段比对至单套染色体组。即使经过严格筛选唯一比对读段,仍发现大量基因呈现"参考基因组主导"现象(数据未展示)。为避免参考基因组偏好性误差,后续采用宏基因组作为参照。最终定义FPKM>2且至少三个样本中ASE比率[=Hap1表达量/(Hap1+Hap2表达量)]显著的基因为ASE基因。
在33,759对DH同源基因中鉴定出4,687个ASE基因,KY的34,502对基因中鉴定出12,237个。绝大多数ASE基因(92.50%,DH-4,375个/KY-11,280个)持续偏好特定单倍型表达(图5B)。偏好转换基因的表达量显著低于稳定偏好基因(附图14)。以宏基因组为参照时,单倍型1主导(DH-2,171个/KY-5,629个)与单倍型2主导(DH-2,204个/KY-5,651个)的ASE基因数量基本平衡(图5B),这些基因在基因组上呈交错分布(附图15)。
DH的4,687个ASE基因周边检测到:上游2kb区(每100bp1.49个SNP)、下游2kb区(1.28)、外显子(0.66)和内含子(0.91)的变异频率,均显著高于等位基因均衡表达基因(分别为1.15/1.02/0.44/0.62)。KY呈现相似模式(图5C),表明ASE基因调控区丰富的等位变异可能导致其表达偏好。
方法部分
转录组分析与等位基因特异性表达(ASE)基因鉴定
同源基因区块鉴定
通过MCScanX软件(Wang等,2012)结合基因组注释与序列信息,鉴定出DHM与DHP间的同线性基因区块,并将位于大基因区块内的基因对确定为等位基因。随后整合DHM和DHP的基因组组装与注释信息,构建宏基因组。
转录组数据比对分析
使用STAR比对工具(Dobin等,2013)将高质量转录组读段比对至宏基因组,关键参数设置如下:
--outMultimapperOrder Random:多比对读段随机分配--outSAMtype BAM Unsorted:输出未排序BAM文件--quantMode GeneCounts:生成基因计数--alignIntronMax 6000:设置最大内含子长度--outSJfilterReads Unique:仅保留唯一比对剪切位点--outFilterMismatchNmax 1:允许最大错配数为1
数据后处理
- 通过SAMtools(Danecek等,2021)对比对结果进行排序与过滤
- 使用Picard工具去除PCR重复的唯一比对读段
- 基于StringTie对宏基因组注释基因的读段进行计数
ASE基因筛选标准
构建所有等位基因对的表达矩阵后,筛选满足以下条件的基因:
- 总表达量>2 FPKM
- 在至少三个样本中呈现显著ASE比率(>0.75或<0.25)
最终鉴定为具有等位基因特异性表达的基因。
金山文档链接
【金山文档 | WPS云文档】 ASE参考文献:猕猴桃的两个单倍型
https://www.kdocs.cn/l/coRzQj1Z1ARq