超级植物-蕨类的三代基因组攻略:ONT超长+Bionano Gen2+Hi-C+NextDenovo

超级植物

蕨类在地球上已经存在了3.35亿年,是现存最古老的植物之一。远在恐龙出现和大陆漂移之前,它们便占据着原始大陆的沼泽森林,通过羽状叶片储存大量太阳能。蕨类死亡后的遗骸被埋葬在泥泞的沼泽沉积物中,经过千万年压缩转化成当代工业革命的能量——煤。

蕨类:基因组,够大;染色体数,够多!

蕨类具有重要系统发育地位,尽管蕨类的基因组数据量仍然有限,但现有数据强烈表明,它们的基因组动力学与所有其他陆地植物截然不同。蕨类基因组的典型特征是染色体数目多这被认为是通过多倍体的多个全基因组复制(WGD)周期产生的。然而,与被子植物多倍体相比,蕨类的多倍体后二倍体化过程通常涉及基因沉默而不是DNA消除,从而导致染色体数目异常增多,同时保持二倍体基因的表达[1]。蕨类染色体的平均数目(n = 63.5)[2]是被子植物平均数目的三倍多(n = 21.55)[3]而蕨类基因组大小平均为12Gb[3],最大甚至达到148Gb[4,5]

蕨类基因组研究现状

对蕨类基因组结构和功能的研究,有利于深入研究其多倍性和染色体进化问题。然而,由于短读长测序组装的技术瓶颈,造成蕨类的基因组测序工作长期止步不前迄今为止,仅测序了满江红(Azolla filiculoides,0.75Gb)和勺叶槐叶萍(Salvinia cucullata,0.26Gb)两个小基因组蕨类[7]。由于缺少参考基因组信息,对蕨类的分子生物学研究也远远落后于其他类型的植物,尤其是种子植物。
测序技术的发展以及成本的降低使基因组测序变得越来越容易,但对于基因组普遍较大的蕨类,有必要仔细计划测序策略并决定对哪些物种测序。最近,康奈尔大学博伊斯汤普森研究所的研究人员统计了最新的蕨类基因组大小数据,并确定了18个跨越蕨类进化树的中型基因组,作为未来蕨类全基因组测序的候选种(图3)[8]。该研究为更好地了解蕨类基因组特征,同时解决长期存在的蕨类多倍性和染色体进化问题,提供了路线图。
图3 蕨类全基因组测序候选种的系统发育位置及其基因组大小[8]
蕨类测序策略:ONT超长+Bionano Gen2+Hi-C+NextDenovo
二代测序见证了过去10年的“基因组大爆发”,超过数百个种子植物基因组被测序发表,但是面对基因组情况复杂的蕨类,二代测序技术捉襟见肘。长读长的三代测序、光学图谱、色体构象捕获等新技术,是目前解决复杂动植物基因组De novo组装的有效策略。
表1 蕨类基因组De novo测序策略
希望组科技服务作为三代测序服务的领跑者,在复杂、大型动植物基因组组装方面有着独特优势。
平台优势——ProthemION48、Saphyr Gen2
牛津纳米孔ProthemION48能够提供平均5Tb/周的高质量长读长测序数据,Bionano Saphyr升级至Gen2平台,数据产出提升4倍,完美适配超大型基因组测序项目。

· 测序优势——ONT ultra-long reads 超长测序技术
 
牛津纳米孔测序测序平台独有的Ultra-long测序能够产生超长测序片段,轻松跨越基因组中连续重复或大片段重复区域,显著提升组装质量,更大限度地还原真实的基因组景观。希望组自2017年推出ONT超长测序服务以来,现已完成昆虫、两栖动物、鱼类、鸟类、哺乳动物、多倍体植物、药用植物等数百个物种的ONT Ultra-long测序工作,并且多个物种测序单Cell read N50突破100Kb!

· 算法优势——NextDenovo
希望组自主研发三代测序数据高效纠错、组装软件NextDenovo,在极大减少计算资源和运行时间的情况下,仍然能够组装出高质量基因组。基于NextDenovo,希望组已经实现了小基因组物种近完成图和>10Gb基因组物种的组装工作。

表2 NextDenovo的组装案例

· 辅助组装——Bionano&Hi-C
希望组同时提供Bionano光学图谱和Hi-C测序服务,在三代测序数据组装基因组的基础上结合不同分辨率的辅助组装策略,打造染色体级别的基因组。
通过以上分析可以发现蕨类基因组动力学与所有其他陆地植物截然不同,对研究植物多倍性和染色体进化有重要的研究价值。在一代测序和二代测序时代,受限于测序技术自身局限性以及测序成本的高昂,很难针对基因组普遍较大的蕨类进行测序,随着长读长三代测序技术的崛起以及测序通量的提升,已经有研究人员开始筹划针对蕨类的大规模基因组测序计划,并整理出了了18个跨越蕨类进化树的中型基因组,作为未来蕨类全基因组测序的候选种。因此,蕨类基因组研究无疑是一片有待深入探究的蓝海,希望组作为三代测序服务的领跑者愿成为您科研航程的领航员!
0 回复

发表评论

想参加讨论吗?
请尽情讨论吧!

发表评论

邮箱地址不会被公开。 必填项已用*标注