Nature Genetics | 三代测序揭示玉米种内存在广泛的基因结构变异

昨日,中国农业大学农业生物技术国家重点实验室及国家玉米改良中心联手未来组、斯坦福大学及冷泉港等团队合作,在Nature Genetics在线发表题为“Extensive intraspecific gene order and gene structural variations between Mo17 and other maize genomes”的文章,公布了一个重要玉米种质的高质量参考基因组,并发现了种内特有的基因顺序及基因结构变异可能对杂种优势和基因组进化产生影响。

玉米(Zea mays)是重要的粮食作物,同时也是一个经典的遗传学模式植物,无论从经济价值还是科研价值来说,玉米的重要性都不言而喻。另外,由于玉米具有高度的种内基因组多态性,所以通过不同的杂种优势群进行杂交产生的后代通常具有极高的杂种优势水平。因此,自近一个世纪前,杂交玉米被广泛种植。大多数现代玉米都是杂交而来,其中“瑞德(Reid)黄马牙”(即自交系B73)和“兰卡斯特(Lancaster)”(即自交系Mo17)是两个最著名的玉米自交系,所以由B73和Mo17杂交产生的后代不仅在全球广泛种植,同时也是遗传学家及分子生物学家热衷研究的对象。无论是对于遗传基因图位克隆还是对杂种优势的分子基础或遗传印记的研究,玉米参考基因组都是必须解决的首要难题,在2009年公布的玉米B73基因组草图可以说是玉米研究领域的里程碑事件。近年来,随着第三代测序技术的不断发展,多项新技术结合打造的高质量植物基因组越来越多地被呈现在大众视野之中。

这篇发表在Nature Genetics上的研究通过三代PacBio SMRT测序技术、二代Illumina HiSeq平台与BioNano光学图谱技术结合,获得了一个高质量的Mo17的参考基因组(Table 1),给予了一个能够广泛比较玉米种内基因组多样性的前所未有的机会。

研究者利用200.8Gb的原始PacBio数据(约90×测序深度),拼装得到的ContigN50达到1.84Mb,并利用267.7Gb的BioNano辅助组装,得到2,560条scaffolds(scaffold N50达到10.2Mb,Table 1)。最终Mo17的基因组大小为2,183Mb,与此前报导的B73基因组(2,106Mb)相仿,经BUSCO评估,此次公布的Mo17基因组覆盖度约97.2%(B73基因组为97.3%),达到了几近完整基因组水平。

Table 1 Mo17基因组组装情况

注释结果显示,Mo17基因组中将近83.83%的序列为重复元件,包括反转座子(75.24%)、DNA转座子(6.12%)以及一些其他的未分类元件(1.72%),并且不同类型的重复DNA的组成与B73和PH207非常相似。此外,研究者还预测了Mo17基因组中的38,620个蛋白质编码基因,预测基因外显子的55%可由5种不同组织的RNA-Seq数据支持,覆盖率至少为90%。共有37,830个(97.95%)预测基因分布在10条模拟染色体上,蛋白质编码基因主要分布在染色体臂内,与转座子密度呈负相关(Fig.1)。

Fig. 1 B73和Mo17的基因组图谱比较

通过对B73和Mo17这两个基因组的比较,研究者鉴定出12,936个B73特有的基因组片段(总计12.96 Mb)和12,939个Mo17特有的基因组片段(总计12.2 Mb),长度大于500 bp,其中大部分(98.7%)小于5kb,并在B73和Mo17中分别发现了200条和126条长于5kb的PAV序列,这些PAV序列在基因组中不均匀分布(Fig.1)。

玉米是一个古老的四倍体植物,其两个亚基因组均经历了广泛的基因分化历程。研究者利用高粱作为参照,发现B73和Mo17经历了同一个四倍体化过程,以及大部分的后续基因分化事件。为了检测哪些基因可能受到选择的压力,研究者计算了B73,Mo17和PH207两两之间同源基因的中性突变率(Ks)。在Ks分布中发现了两个峰值:一个对应了一组由于近期遗传交换而产生的基因(Ks<0.0028),另一个则代表了余下的大部分基因,这些基因可能是在210万年前从玉米的共同祖先分化而来(Ks~0.025)。随后,研究者计算了Ks在0.0028到0.25之间的基因的Ka/Ks值。因为大多数非同义突变是有害的,并且经历了很强的净化选择,所以这些基因的Ka/Ks正如研究者预期一样,均明显偏向于零(Fig.2)。也就是说,这三个基因组中,均只有相对少数(1,000个左右)的基因受到正向选择(positive selection,Ka/Ks> 1),绝大部分(约7000个)基因仍处于进化约束之下(Ka/Ks < 0.1)。

Fig. 2 B73、Mo17和PH207基因组的进化

另外,比较分析结果显示,B73中的33,681个基因和Mo17中的33,597个基因同源或部分基因片段存在共线性,但同时也发现二者的基因有很多不存在共线性(包括5,105个B73基因和4,008个Mo17基因),因为在它们各自对应的基因组中的10 Mb范围内没有发现任何同源基因或基因片段(Table 2)。同时,PH207中的2,112个基因与B73和Mo17基因组中均不存在共线性。

20%以上的预测基因在B73、Mo17和PH207的任何两个自交系之间都表现出明显的蛋白质序列变异,表明这三个具有代表性的玉米自交系之间存在潜在的功能互补。值得注意的是,在非共线性基因中的大效应突变和大结构变异的比例显著高于共线性基因(χ2检验,p<2×10−16)。

Table 2 B73和Mo17之间的基因多态性

该研究利用三代测序技术揭示了玉米种间存在的大量非共线性基因、种内基因组结构变异及基因差异表达等,这些因素可能是造成玉米世系特异性的重要原因之一,因此评估这些非共线性基因对农业性状定量表型变异的影响将是未来一个很有价值的研究方向。

参考文献:

Sun, S. et al. Extensive intraspecific gene order and gene structural variations between Mo17 and other maize genomes. Nature Genetics (2018).

0 回复

发表评论

想参加讨论吗?
请尽情讨论吧!

发表评论

邮箱地址不会被公开。 必填项已用*标注