未来组又一篇Nature Communications || 高质量苹果基因组撩动你心

2019年4月2日,中国农业科学院果树研究所与武汉未来组等单位共同合作的研究成果“A high-quality apple genome assembly reveals the association of a retrotransposon and red fruit colour”发表于国际顶级期刊Nature Communications。中国农业科学院果树研究所张利义副研究员与未来组生物信息研发总监胡江为本文并列第一作者,中国农业科学院果树研究所丛佩华研究员与未来组创始人汪德鹏为本文共同通讯作者,武汉未来组的李净净,田玉等四人为本文共同作者。本研究以来源于花药的苹果纯合系HFTH1为材料,采用三代PacBio测序技术,结合光学图谱Bionano和Hi-C技术辅助组装,获得高质量苹果基因组图谱(contigN50为6.99Mb,2017年发表的苹果基因组contigN50为620kb)。有趣的是,进一步研究发现花青素生物合成的核心转录激活因子MdMYB1上游UTR区域的一个LTR反转录转座子的插入与果实红色相关联。本研究为探讨红色果实着色的分子机制提供了重要见解,同时突出了高质量的基因组组装在破解苹果重要农业性状中的实用性。

苹果基因组是苹果遗传研究和分子育种的基础,可推动苹果的可持续生产。尽管早前发布的高质量金冠(Golden Delicious)基因组使苹果育种研究取得了一些进展,但仅仅利用这些数据在发现新基因和描述基因组结构变异方面仍存在一些局限性。

材料选择

在中国北方地区广泛栽培的寒富(Hanfu)品种是高度杂合二倍体,经过花药体外培养的纯合子植株HFTH1(三倍体)大大降低了杂合度(Fig.1);通过对相应Illumina reads进行SNP calling,发现与先前发表的双单倍体金冠(GDDH13)相比,HFTH1的纯合度更高(Fig.2),高度纯合的基因组有利于提升基因组组装质量。

Fig.1花药培养再生植株HFTH1表型与杂合子供体(HFP)基因型的显著变化

Fig.2 GDDH13及HFTH1基因组中的SNP数量

基因组组装及质量评估

对~117× PacBio数据(平均读长13.1 kb)进行初步组装,获得了一个初步组装结果:基因组大小656.52 Mb,Contig N50 4.63 Mb;随后使用PacBio长reads及Illumina 数据对组装结果进行polish;应用~224× Bionano光学图谱数据将polish后的contigs组装成scaffold;随后,应用145× Hi-C数据进行精确聚类并排序,最终组装出一个高质量的苹果基因组,包含17条模拟染色体(Fig.3a,3b),基因组大小658.90 Mb,contig N50 of 6.99 Mb;此外,还将160,068 bp叶绿体基因组和396,939 bp线粒体基因组组装成完成图。

Fig.3 (a)17条染色体间的Hi-C互作图(100-kb resolution);(b)HFTH1基因组特征

本研究组装的HFTH1基因组在7条染色体的两端和8条染色体的一端共捕获22条长端粒序列(拷贝数从294到1073,Fig.3b)。BUSCO评估基因完整度达到~97.0%,覆盖公共数据库Malus domestica基因组中98.02%的ESTs。将组装结果进一步与水稻基因组(RGAP7)和拟南芥基因组(TAIR10)比较,发现HFTH1基因组BUSCO评估与两者都很接近,表明我们组装的基因组完整度达到模式植物的水平。

基因注释
研究者在苹果HFTH1基因组中注释出44,677个蛋白质编码基因,其中~4.29%的基因位于GDDH13基因组的gap区。在HFTH1和GDDH13基因组中分别注释出393.88 Mb 和362.18 Mb的转座元件(TEs)。HFTH1基因组中每条染色体中部都有一个高度重复的区域(重复序列含量>90%),研究者推测这些区域可能是异染色质区的一部分(Fig.3b),而这些区域中最丰富的重复元件属于Copia-7家族。
金冠和寒富比较基因组分析
基因组的结构变异是物种表型多样性的重要来源。通过HFTH1和GDDH13基因组比较分析发现,HFTH1基因组中有18,047个缺失,12,101个插入和14个大的倒位(INVs,Fig.4)。研究者将其中与GDDH13中共有的结构变异定义为GDSVs,其中一个包含SINE的GDSV插入到了抗病基因的3′UTR区域,还有一个GDSV则是在C-repeat/DRE结合因子(MdCBF2,寒冷适应相关的主要调控基因)5′UTR区发生了缺失。研究者还发现,这些GDSVs中的插入和缺失片段大小相近,且超过70%的GDSVs与TEs相关。

Fig.4 结构变异特征

寒富LTR反转录转座子动态演化

转座子在物种适应性进化中扮演重要角色,而在苹果基因组中,超过75%的转座子都是LTR-RTs,为了追溯苹果基因组中LTR-RTs的动态演化历程,研究者在HFTH1基因组中鉴定了7,313个完整的LTR-RTs,平均读长7,868 bp(Fig.5a)。其中约62%的LTR-RTs在金冠基因组中同样存在(Fig.5b),说明这些LTR-RTs可能早已插入到寒富和金冠的共同祖先中。在蔷薇科基因组中,梨和苹果有共同相对保守的基因组,但由于梨基因组较片段化,在梨基因组中只发现了40个完整的LTR-RTs,进一步的分析表明,苹果基因组中的大多数LTR-RTs可能是在梨与苹果分化之后插入苹果基因组的,这一结果与这些LTR-RTs平均插入时间(0.8 MYA)显著低于苹果和梨估算的分化时间(8.1 MYA)相一致(Fig.5c)。比较HFTH1和GDDH13基因组,其中一半以上共有的LTR-RTs高度相似(identity≥0.99,Fig.5b),且共有的LTR-RTs及其侧翼区域的平均累积核苷酸替换(CNS)低于基因组的平均水平(Fig.5d)。

Fig.5 HFTH1基因组完整LTR反转录转座子演化

进一步对LTR-RTs进行分析,发现两侧有2个TSDs的特异LTR-RTs(占总LTR-RTs的31.9%)只在HFTH1基因组中发现(Fig.5b),在GDDH13基因组的对应位置却只有1个TSD,表明特异的LTR-RTs是在寒富和金冠分化之后插入的。这些特殊的插入事件,特别是在基因内或靠近基因区的,可能是在较强选择下固定下来的,因为蛋白编码基因占总基因组的22.22%,但只有12.05%的插入事件是在基因内发生。在基因区附近观察到的插入事件也比预期的少(Fig.5e)。而且,靠近这些插入位点的基因其平均表达水平也比总基因集低。但是,当插入在大于1kb的基因上时,则选择压力很弱或者丧失(Fig.5e)。进一步分析发现,与64.39%共有的LTR-RTs相比,82.54%的特异LTR-RTs至少在一个受测样本中表达,暗示大部分的特异LTR-RTs都年轻且富有活性。插入事件不仅影响附近基因的表达,而且增加了插入位点附近的突变率。本研究数据还发现随着与LTR-RTs距离的增加, CNSs逐渐减少(Fig.5d)。同时,研究者发现随着LTR-RTs分化时间的增长平均的CNSs也增加(Fig.5f),但是当转座子逐渐失活变成非功能性序列时,平均CNSs速率呈下降趋势并逐渐达到瓶颈(Fig.5g)。此外,研究者发现HFTH1基因组中2.9%的LTR-RTs在GDDH13基因组中可能已经被选择性清除。清除的LTR-RTs周围序列的平均CNSs在基因组中最高(Fig.5d),暗示在TEs演化过程中,清除事件可能比插入产生更大的影响。在HFTH1基因组中TEs的动态演化可能创造了独特的遗传和表型特征。

反转录转座子与苹果红色的关联性

比较 HFTH1 和 GDDH13基因组MdMYB1序列,结果表明MdMYB1的编码序列是一致的,但是,在内含子区域发现了1个SNP,在上游区域发现15个SNPs和5个Indels。其中,GDDH13有1个501bp的插入,HFTH1有1个4097bp的插入,为gypsy-like LTR 反转录转座子,被称为redTE(Fig.6a)。尽管在HFTH1基因组中发现有3913个gypsy-like LTR 反转录转座子,但只有1个与redTE具有96.26%的相似性(被称为redTE-like),其它的相似度均低于75.10%。有意思的是,研究者发现redTE-like只存在于在HFTH1基因组中,在GDDH13基因组中没有发现,其两侧的LTR序列突变更多,这一结果暗示redTE-like比redTE更古老。

为研究上述的不同是否与苹果果实的颜色相关,研究者从数据库中调取这些有差别的序列进行比较。结果发现HFTH1基因组中的16个SNPs和2个Indels在非红皮品种也存在,而GDDH13的501bp插入在红皮品种中也被发现。随后,研究者研究了redTE与苹果红色的关系。对已知的112个红皮品种和非红皮品种进行redTE的PCR研究,结果发现在所有的红皮品种中均发现有redTE,而非红皮品种中均没有redTE(Fig.6b),暗示redTE插入可能与苹果的红果皮相关。接着,研究者筛选了75个非红皮品种HuaYue与红皮品种Honeycrisp的杂交后代(包括41个红皮品种和34个非红皮品种),同样证实了红皮表型与redTE的共分离(Fig.6c)。由此可见,redTE与苹果的红皮表型相关。后续研究者还通过Transient方法证明redTE可作为增强子,且redTE可调节苹果光响应基因MdMYB1的高表达。

Fig.6 苹果红色表型与一个LTR反转录转座子的关联性

讨 论
高质量的基因组组装对于识别结构变异、整合表型-基因型关联、深入了解基因组进化以及阐明重要性状的遗传结构具有重要价值。本研究的参考基因组可对GDDH13基因组进行高质量补充,可精确识别大的和复杂的SVs,同时,为苹果独特的生物学特征的比较基因组研究和种类基因组多样性研究奠定基础。比较基因组结果表明,TEs的动态变化可导致产生大量的SVs,这可能会对基因型产生影响。redTE的发现将激发研究人员进一步探讨TEs作为主要表型变异创造者的重要性。事实上,TE诱导的影响在基因组水平的分析还只用在人和几种农作物上。因此,HFTH1和GDDH13基因组的TEs注释可用于不同苹果基因型更多TEs多态性的动态活性和功能影响的详细研究。苹果果实颜色的进化非常重要也非常有趣。在本研究中,我们在MdMYB1启动子上游UTR区域发现了一个redTE插入与红色果实着色相关。redTE被认为是一种增强子,可通过降低光响应阈值来控制红色果实着色。没有这个增强子,栽培品种的果实就不能有效的产生花青素。这种现象很好的解释了为什么非红皮品种在强光下仍然呈现微弱的红色。此外,TEs特异位点也可用来追溯物种的遗传关系和起源。世界范围的苹果遗传学多样性研究和谱系记录表明一个黄皮品种Golden Delicious(1916年)和四个红皮品种[Coxs Orange Pippin (1850), Red Delicious (1880),Jonathan(1826年)和McIntosh(1870年)]是现代苹果育种的共同祖先。这四个红皮品种包含redTE插入(Fig.5b),这表明它们有共同的亲本。值得注意的是,M. sieversii也含有redTE,表明redTE可能起源于它在新疆的原始野生祖先。尽管最近的基因组重测序揭示了新疆的M. sieversii是一个古老的生态型,与苹果的驯化没有直接关系。中国具有2000多年的栽培史的Huacaiping品种是从新疆野生苹果驯化而来,含有redTE,这暗示红苹果曾经沿着古老的丝绸之路向西和向东延伸。这个结果与驯化苹果的起源和历史的地理调查以及育种研究相一致。此外,从redTE诱导突变祖先的红苹果在人工选择上越来越受欢迎。有趣的是,最近一项关于血橙的研究表明这两种不同的TE插入在控制冷诱导的Ruby表达方面产生了类似的效果,而Ruby可以进行调节果实的颜色。这一发现增加了苹果中其他TE插入的可能性, 其着色效果还没有明显特征。是否有类似的redTE插入增强MYB在梨或蔷薇科的其他水果中的转录还有待进一步研究。

由于苹果育种困难且周期长,研究者希望组装一个可用于指导苹果MAS(marker-assisted selection)育种的参考基因组。本研究中,研究者在基因组中发现了大量的结构变异,这将在苹果育种的分子标签开发中发挥重要作用。如,基于redTE的特定标记,是预选目标颜色苹果杂交苗特别有价值的工具,因为它比以前的标记更有效,更精确。这种标记可以通过消除大量的非靶标杂交苗而大大降低苹果育种成本。此外,来自于抗性亲本的HFTH1基因组将为苹果抗寒性和抗病性的标记开发奠定良好的基础,如苹果育种中的分枝环腐病和黑斑病。总之,这个近完成基因组图谱和其他基因组资源将有助于基因和功能标记的挖掘,并支持将研究成果转化为遗传改良,实现可持续的苹果生产。

参考文献

Zhang, L. et al. A high-quality apple genome assembly reveals the association of a retrotransposon and red fruit colour. Nature Communications 10, 1494 (2019).

论文链接

https://www.nature.com/articles/s41467-019-09518-x

未来组部分高分合作文章

0 回复

发表评论

想参加讨论吗?
请尽情讨论吧!

发表评论

邮箱地址不会被公开。 必填项已用*标注