海岛棉、陆地棉的基因组进阶之路

近期,海岛棉(Gossypium barbadense, AD2)和陆地棉(Gossypium hirsutum,AD1)基因组的文章继2018年之后再一次发表在Nature Genetics杂志上。这两种棉de novo基因组文章一波又一波,还能是Nature系列这样的顶级杂志,这是为什么呢?今天来介绍海岛棉、陆地棉基因组的进阶之路及其背后的科学故事~

     

Fig.1 海岛棉(左)与陆地棉(右)

棉花种质资源丰富,群体组成复杂。棉花属共包括46个二倍体(2n=2x=26)棉种和5个已经确认的四倍体(AD1-AD5,2n=4x=52)棉种,所有的二倍体棉种均可能由一个共同的祖先进化而来,这个祖先随后多样化分化成八个基因组,包括A、B、C、D、E、F、G和K。而所有的四倍体棉花物种都是由A基因组物种木本棉(又称亚洲棉)(G.arboreum (A2))和D基因组物种雷蒙德氏棉(G.raimondii (D5))物种间杂交形成。

Fig.2 棉花属系统发育和进化.不同棉花种基因组大小和核型(zhang ,Peng et al 2008.)

2012年8月,棉花重要种质雷蒙德氏棉(Gossypium raimondii)基因组问世[1],为棉花基因组学研究领域提供了有效的参考信息。雷蒙德氏棉的祖先被认为是海岛棉和陆地棉的D基因组供体。同年12月,又一篇棉花基因组文章发表在Nature杂志,揭示棉花基因组多倍化事件及棉花纤维的演化历程[2]。2014年,海岛棉和陆地棉的另一个供体A基因组亚洲棉 (Gossypium arboreum) 全基因组草图也被绘制出来[3]棉花A组和D组基因组测序的完成, 为异源四倍体海岛棉和陆地棉的全基因组测序奠定了基础。

Fig.3 棉花纤维的演化

海岛棉和陆地棉是棉花的主要栽培品种,陆地棉产量高,适应性强,海岛棉产量低,栽培区域性强,仅能在新疆、埃及、美国亚利桑那州等少数干旱地区种植,但是其纤维品质比陆地棉优。基于高质量、高精度的基因组认识棉花的复杂性,进化的多样性,挖掘性状背后的分子机制培育出综合海、陆棉花高产、纤维优良、适应性强的新品种一直是棉花工作者努力的目标。因此,海岛棉和陆地棉基因组备受人们的关注。

Table 1 海岛棉与陆地棉基因组文章列表

2015年4月,两篇陆地棉基因组文章同时发表在Nature biotechnology期刊:

以中国农科院棉花研究所为主的科研人员对陆地棉遗传标准系—TM-1进行了全基因组测序和组装,最终获得了26条染色体[4]。利用比较基因组学方法,首次从全基因组水平揭示了四倍体棉花是由A基因组的祖先和D基因组的祖先通过染色体融合而形成,并初步揭示了四倍体棉花基因组的进化规律。

Fig.4 陆地棉的演化及基因组共线性分析[5]

另一篇文章同样以陆地棉为研究主体,利用Illumina测序平台,结合BAC末端序列和高密度的SNP遗传图谱,成功构建了高质量的陆地棉全基因组图谱[5];解析了四倍体棉花两个亚基因组的非对称进化机制;发现了MYB基因家族中的一个分支在纤维发育中起重要的作用,陆地棉中多个纤维素合酶等糖代谢基因在驯化过程中受到了显著的正选择作用,与棉纤维品质改良有直接关系。

2015年9月,中国科学院上海生物科学研究所公布了海岛棉基因组[6],并通过基因组比较分析方法研究海岛棉超长纤维的演化及特殊代谢机制。

Fig.5 异源四倍体棉花进化的示意图

2018年12月在Nature Genetics上发表的棉花基因组文章[7]又再次提升了海岛棉和陆地棉的基因组组装质量,该研究利用第三代测序技术(PacBioRS II),BioNano光学图谱技术和染色质高级结构捕获技术(Hi-C)进行联合组装。与以前发表的基因组草图相比,该项研究组装的基因组序列在连续性和完整性上有极大提高。通过比较分析,研究者还发现了棉花基因组多倍化后的复杂结构变异,同时定位了与优质纤维相关的基因座。

Fig.6 海岛棉和陆地棉基因组染色体特征

2019年3月,又一篇棉花基因组文章发表于Nature Genetics,其中应用llumina、10Xgenomics及Hi-C技术获得的海岛棉Hai7124及陆地棉TM-1基因组再次提升参考基因组的精度[8]。研究者指出,本次组装在在重复DNA富集的着丝粒区有明显的改善。全基因组比较分析显示,基因表达、结构变异和基因家族扩张是这些物种形成和进化的原因。这些发现有助于阐明棉花基因组的进化及其驯化历史。

Fig.7 海岛棉Hai7124及陆地棉TM-1基因组特征

参考文献:

[1] Wang, K. et al. The draft genome of a diploid cotton Gossypium raimondii. Nature Genetics 44, 1098 (2012).

[2]Paterson, A.H. et al. Repeated polyploidization of Gossypium genomes and the evolution of spinnable cotton fibres. Nature 492, 423 (2012).

[3] Li, F. etal. Genome sequence of the cultivated  cotton Gossypium arboreum Nature Genetics 46,567(2014).

[4] Li, F. et al. Genome sequence of cultivated Upland cotton (Gossypium hirsutum TM-1) provides insights into genome evolution. Nature Biotechnology 33, 524 (2015).

[5] Zhang, T. et al. Sequencing of allotetraploid cotton (Gossypium hirsutum L. acc. TM-1) provides a resource for fiber improvement. Nature Biotechnology 33, 531 (2015).

[6] Liu X, Zhao B, Zheng HJ, et al. Gossypium barbadense genome sequence provides insight into the evolution of extra-long staple fiber and specialized metabolites. Sci Rep. 2015;5:14139. Published 2015 Sep 30. doi:10.1038/srep14139

[7] Wang, M. et al. Reference genome sequences of two cultivated allotetraploid cottons, Gossypium hirsutum and Gossypium barbadense. Nature Genetics 51, 224-229 (2019).

[8] Hu, Y. et al. Gossypium barbadense and Gossypium hirsutum genomes provide insights into the origin and evolution of allotetraploid cotton. Nature Genetics (2019).

0 回复

发表评论

想参加讨论吗?
请尽情讨论吧!

发表评论

邮箱地址不会被公开。 必填项已用*标注