Cell+Nature!希望组NextDenovo+Ultra-long 助力肺鱼基因组解析!

肺鱼是现存最接近四足动物的近亲,并保留了由水生向陆生过渡相关的祖先特征。现存的6种肺鱼,有4种生活在非洲,1种生活在南美,还有1种生活在澳大利亚。近日,2个不同的研究团队分别以非洲肺鱼和澳洲肺鱼为研究对象在国际顶级期刊Cell和Nature上发表了研究成果。肺鱼基因组是迄今为止报道的最大的动物基因组(约40Gb),基因组中大量的重复序列(>60%)进一步增加组装的难度,希望组凭借领先的ONT Ultra long测序和自主开发的NextDenovo基因组组装技术分别助力两研究团队完成了高水平的基因组组装,其中,为非洲肺鱼文章提供了Nanopore测序和NextDenovo、NextPolish软件的使用,使得该超大基因组的BUSCO评估达到95%以上,武汉希望组生物科技有限公司胡江为本文的共同第一作者;为澳洲肺鱼文章提供了Nanopore Ultra-long测序服务。

图1 非洲肺鱼

African lungfish genome sheds light on the vertebrate water-to-land transition

发表期刊:Cell (IF:38.637)

研究对象:非洲肺鱼

主要测序技术:Nanopore1D、BioNano和Hi-C

主要完成单位:西北工业大学生态与环境学院、中国科学院水生生物研究所淡水生态与生物技术国家重点实验室、中国科学院昆明动物研究所遗传资源与进化国家重点实验室等

第一作者:王堃、王俊、朱成龙、杨连东,任彦栋、阮珏、范广益、胡江(希望组)

通讯作者:王文、何舜平、邱强、赵文明

希望组贡献:提供基因组测序和NextDenovo、NextPolish软件及组装技术支持

非洲肺鱼染色体基因组组装、重复序列与进化分析
研究团队利用Nanopore Ultra long、BioNano和Hi-C测序,采用NextDenovo + wtdbg2 + NextPolish策略组装,最终获得约40.05 Gb的基因组,Contig N50达到1.60 Mb;结合BioNano和Hi-C数据对基因组构建Scaffold和辅助染色体挂载,最终得到17条染色体,Scaffold N50 2.81 Gb,染色体挂载率达到99%以上。BUSCO评估显示该基因组包含了95%以上的脊椎动物完整基因。非洲肺鱼基因组如此巨大主要是由TEs的扩张引起的,非洲肺鱼基因组的61.7%(24.7 Gb)被注释为重复序列。研究团队通过分析Kimura distance估算了TE历史扩张活动,结果表明TEs,特别是反转录转座子,在过去7000万年中一直活跃。基于基因组组装和注释结果,通过对8种脊椎动物的5149个单拷贝基因进行系统发育重建,证实非洲肺鱼是与四足动物最近的姐妹谱系,非洲肺鱼和四足动物的分化时间可追溯到泥盆纪伊始,估算为419 MA。

图2 非洲肺鱼染色体水平基因组组装和进化史

基因改变增强了呼吸能力
肺呼吸能力的进化可能经历了三个步骤:第一步是硬骨鱼的共同祖先已具备了最初级的呼吸空气的能力(已有文献支持),本研究中检测到所有硬骨鱼中存在Sftpb同样也证实这一观点。第二步是通过诸如Sftpc的出现和邻近Foxp1的保守非编码元件(CNEs)等基因创新,肉鳍鱼类的共同祖先获得了增强空气呼吸的能力。第三步可能是进一步的基因创新,包括SftpaSftpd的出现以及Foxp2附近保守非编码元件(CNEs)的出现,为四足动物进化出呼吸系统提供了最后的关键基础。

图3 肉鳍鱼类肺呼吸功能的演变

五趾肢的起源与陆地运动
五趾的出现是脊椎动物从水生到陆生过渡的标志事件。研究者在Hoxa11上游200 bp处发现了一个长度为67 bp的四足动物特有的保守非编码元件(CNE),这个四足动物特有的CNE可能是五趾肢起源的关键基因创新。通过不同的四足动物比较验证了这一观点(在两栖类、鳄鱼、海龟和哺乳动物中,这一元件高度保守,但在蛇和鸟类的基因组中却发生了相当大的改变)。从近端到远端,四足动物的四肢由鳍到肢的过渡形成了上肢、中肢和掌部三部分。转录组和基因组数据验证了and1/2and3Hoxb13基因可能与鳍肢过渡有关。除了发生形态学变化外,四足动物还需要运动神经元刺激控制四肢的肌肉。研究发现位于Hoxc10(已被证实在小鼠腰椎运动神经元、分区和运动池识别中发挥关键作用)上游(3 Kb和2.5 Kb)的2个四足动物特异性的保守非编码元件(CNE)是候选增强子,可能与四足动物的地面运动有关。

图4  肢起源和与陆地运动相关的基因变化

基因改变增强了抗焦虑能力
脊椎动物从水到陆地的过渡过程中,伴随着大脑边缘系统的变化。通过全基因组扫描,研究者在肺鱼和四足动物最后的共同祖先谱系中发现了两个新基因Npsr1Nps,这两个基因分别编码神经肽S受体(Neuropeptide S receptor, NPSR)和神经肽S(Neuropeptide S, NPS),具有促进兴奋和抗焦虑的作用,可调节承压能力,增强杏仁核突触抑制。研究结果表明,Npsr1基因起源于肉鳍鱼类催产素受体基因的复制,主要在大脑和脊髓中表达。Nps起源于肉鳍鱼类的前体序列。除了NPS/NPSR系统外,杏仁核内的γ -氨基丁酸(GABA)是另一种重要的抑制神经递质,用于控制恐惧和焦虑的感觉。GABA相关基因在硬骨鱼类中高度保守的元件在肺鱼与四足类动物的最近共同祖先中却发生了插入或缺失。第一个基因IgSF9b有6个AA缺失;第二个基因Arfgef1有两个AA插入。此外,编码生长激素的Gh基因被检测到在四足动物和非洲肺鱼的大脑中特异性表达,杏仁核中Gh基因上调与恐惧记忆的形成有关。总之,这些由肺鱼和四足动物共享的基因创新与之前的研究一致,即类似四足动物的杏仁核复合体起源于肺鱼和四足动物共同祖先世系。

图5 与杏仁核和抗焦虑能力相关的基因改变

基因变化与咽重塑
随着陆生脊椎动物的主要呼吸功能由鳃向肺转移,鳃弓不再产生鳃。鳃弓也从肉鳍鱼类的5个减少到四足动物的4个或3个。Hoxb3基因在调节咽弓的发育中起重要作用。位于Hoxb3上游4 Kb处的非编码元件(CNE)存在于在大多数脊椎动物中,但在四足动物中该区域已不再保守。这可能是由于两个咽弓缺失导致选择松弛的结果。与此同时,人类等四足动物胚胎发育阶段的第二咽弓被重塑,用以覆盖更多的尾弓,导致后弓内在化,并在后端丢失了一个外开口。自四足动物出现后,甲状旁腺便出现在咽后囊中,这些腺体负责调节释放体内储存的钙,而在鳍刺类鱼中是通过鳃来实现这一功能。Pax1基因是与第二弓后咽袋和甲状旁腺的发育直接相关。研究者在Pax1上游发现了一个四足动物特异性的保守非编码元件(CNE),它能起到增强子的作用。Gcm2基因对甲状旁腺的分化和存在也至关重要。比较研究发现该基因在鳐鱼和非洲肺鱼的鳃中高度表达,而在爪蛙的鳃中表达量较低,说明在四足动物中,相应的功能已经从鳃转移到了甲状旁腺。
 

图6 与咽重塑相关的基因变化

Giant lungfish genomeelucidates the conquest of land by vertebrates
发表期刊:Nature (IF:42.778)

研究对象:澳洲肺鱼

主要测序技术:Nanopore1D 、Ultra long和Hi-C

主要完成单位:德国康斯坦茨大学生物系、德国维尔茨堡大学生物中心等

第一作者:Axel Meyer、Siegfried Schloissnig、Paolo Franchini、Kang Du、Joost Woltering

通讯作者:Axel Meyer、Manfred Schartl、Elly M. Tanaka、Thorsten Burmester、Oleg Simakov

希望组贡献:提供NanoporeUltra-long测序服务

图7 澳洲肺鱼

澳洲肺鱼的基因组测序与陆地运动的进化
研究者利用Nanopore 1D 和Ultra long技术对澳洲肺鱼进行了全基因组测序组装,最终组装出37Gb,Contig N50达1.86Mb的澳洲肺鱼基因组。之后利用271Gb Hi-C 数据,对基因组进行染色体级别组装,最终得到Scaffold N50 1.75Gb,组装出了17条大染色体和10条小染色体。BUSCO评估组装的基因组包含67%的脊椎动物完整基因。肺鱼是属于肉鳍鱼类中的一类,肉鳍鱼的叶状鳍在进化中最终形成了适于陆地爬行的足趾。通过比较基因组分析,研究者对保守的四足动物肢体增强元件的分析表明,有31种起源于肉鳍类。与sall1相关的hs72增强子驱动掌部区域基因表达。sall1在肺鱼胚胎中高表达,并呈现类似于四足动物的表达模式,但在斑马鱼的鳍发育过程中不表达。这表明该基因功能和肺鱼的肉鳍类叶状鳍发育相关。hoxc基因在双鳍和四肢中的表达仅在与甲床相关的哺乳动物中报道过,而RNA-seq分析发现在肺鱼幼体鳍部hoxc基因有表达。研究者还发现hoxc13在蝾螈肢中表达,在辐鳍鱼的胸鳍中不表达,转录本定位显示hoxc13也在肺鱼胚胎远端鳍表达。这表明在四足动物中,该基因结构域可能调控肢体元素生成,如指甲、蹄和爪。hoxcsall1一起,证明了早期肉鳍类起源的四肢样基因表达促进了鳍肢过渡。

图8 肉叶鳍的预适应调节与hoxd基因调控

总之,这2篇高水平的基因组文章分别以非洲肺鱼、澳洲肺鱼为研究对象,分析了肺鱼类的物种和基因组特点,并从不同视角推演了脊椎动物从水生到陆生进化过程,增加了我们对脊椎动物陆生进化的理解,为鱼类到人类的进化提供了宝贵的资源。

作为三代测序基因组学中心,希望组拥有最新的Oxford Nanopore PromethION、PacBio Sequel II、BioNano光学图谱和HiC等技术,是目前国内少数能同时稳定产出高质量ONT ultra-long reads和 PacBio HiFi reads的服务商之一。并自主开发了NextDenovo/NextPolish系列三代测序组装软件,同时配备高水平生信分析团队,完全可以解决超大型基因组的难题,我们将继续致力于攻克更多超大型复杂动植物基因组图谱,为您提供高质量、高准确度的测序、组装、分析服务。

0 回复

发表评论

想参加讨论吗?
请尽情讨论吧!

发表评论

邮箱地址不会被公开。 必填项已用*标注