项目文章|物种形成研究揭示峨眉锥栗的杂交起源和生殖隔离位点的非均匀分布

研究同倍体杂交物种形成的难点在于,检验杂交直接影响生殖隔离的形成。如果我们能观测到生殖隔离位点呢?

西双版纳植物园孙永帅团队在Nature Communications发表了题为Genomic basis of homoploid hybrid speciation within chestnut trees的研究论文,该研究以中国特有的峨眉锥栗研究系统为材料,应用进化生态基因组学研究方法,发现了一个树木杂交物种以及生殖隔离位点的分布式样。

 

物种形成模型可分为二歧分支式物种形成和杂交物种形成。二歧分支模型中,每个物种只对应一个祖先群体。杂交物种则源自于两个或多个类群。进一步地,杂交成种分为多倍体杂交成种和同倍体杂交物种形成。多倍体物种形成较常见于植物界。而同倍体杂交物种形成类群颇为少见。迄今,有5个认可度较高的同倍体杂交物种形成类群,均分布在美洲。

 

现存物种及类群间的生殖隔离强度往往高于其祖先群体间的隔离强度。孙永帅团队将这一原理引入到进化生态学与基因组学交叉研究中。即,在与生殖隔离关联的基因组区域上,现存类群间的基因流应低于其祖先群体间的基因流。在生殖隔离位点上,亲本物种的等位基因往往因环境、遗传限制而不能共存。基于这些原理,该团队应用群体基因组学方法鉴定了中华板栗(也称板栗)和锥栗的生殖隔离位点,进而用之检验峨眉锥栗是否起源于板栗和锥栗间杂交。与此前研究报道的5个同倍体杂交成种的实验设计不同,在峨眉锥栗杂交系统中,板栗和茅栗的姐妹种对关系为鉴定板栗和锥栗的生殖隔离位点提供了天然对照和便利(图1)。

 

该研究首先用多个方法分析峨眉锥栗与板栗、锥栗的遗传差异,为峨眉锥栗的分类地位提供了基因组学证据。然后,采用hhs方法、溯祖模型比较分析等对峨眉锥栗的杂交起源过程进行解析,并估算亲本物种对峨眉锥栗基因组的相对贡献。随后,该研究鉴定了与生殖隔离关联的候选基因组位点。在峨眉锥栗基因组中,仅6个生殖隔离位点来自于板栗。基因功能注释分析发现两个花期关联基因位于本研究鉴定的生殖隔离关联位点上。这些结果表明,亲本物种间生殖隔离位点的重新组合可为新物种形成的重要机制。深入分析发现,候选生殖隔离位点偏集中分布于基因组的低重组区域。研究认为,自然选择和遗传重组间互作塑造了峨眉锥栗基因组的进化过程。

 

西双版纳植物园植物进化生态学研究组孙永帅博士为研究论文的第一作者和通讯作者。该项研究得到了国家自然科学基金委,中国科学院和云南省的经费支持。

1. 4个栗属Castanea类群的样品采集地(a)、演化关系(b)、遗传结构(c),以及板栗基因组的重组率分布以及生殖隔离位点的分布式样(d)

项目文章| 三代测序助力蝶蛹金小蜂高质量基因组发布

近日,浙江大学叶恭银教授与方琦副教授团队联合美国罗彻斯特大学和美国密苏里大学,在Molecular Ecology Resources杂志在线发表题为“A Chromosome-Level Genome Assembly of the Parasitoid Wasp Pteromalus Puparum的研究论文。该研究利用三代测序技术组装出了蝶蛹金小蜂高质量的染色体水平基因组,为寄生蜂的分子生物学、系统进化和生物防治研究提供了有价值的资源。浙江大学博士生叶昕海、严智超博士(现为南京农业大学副教授)、博士生杨义为论文共同第一作者,浙江大学叶恭银教授与方琦副教授、美国罗彻斯特大学John H. Werren教授为本文共同通讯作者。此外,浙江大学李飞教授、姚洪渭副教授,美国密苏里大学宋齐生教授等共同参与完成此项研究工作。希望组承担了本研究中二代、三代测序及Hi-C测序工作。
膜翅目寄生蜂在农田生态系统中是一类非常重要的生物防治的昆虫,蝶蛹金小蜂(Pteromalus puparum)是十字花科蔬菜害虫菜粉蝶蛹期优势内寄生蜂。它能够将一种或多种寄生因子注入寄主体内,用来抑制寄主免疫、调控寄主生长发育和营养代谢等生理活动,是研究寄生蜂与宿主相互作用的理想实验室模型。

                                                      图1蝶蛹金小蜂在其寄主菜粉蝶上的生活史

本研究结合短读长、长读长测序和Hi-C技术,生成了高质量染色体水平蝶蛹金小蜂基因组装配。组装的基因组大小为338 Mb,contig N50为38.7 kb,scaffold N50为1.16 Mb,结合Hi-C数据将scaffold组装到5条染色体上,scaffold N50提升至65.8 Mb,其中96%以上的组装碱基位于染色体上。基因组BUSCO评估达98%,表明该装配具有很高的完整性,为后续研究提供了极好的基因组资源。

                                图 2 蝶蛹金小蜂基因组景观。I 5条染色体;II 重复序列密度;III 基因密度;IV GC含量。

研究者利用蝶蛹金小蜂及其他12中代表性膜翅目昆虫的3399个单拷贝基因构建系统发育树,蝶蛹金小蜂与丽蝇蛹金小蜂进化关系最为接近,在约19 Mya年前发生分化(图3a)。GO分析发现蝶蛹金小蜂基因组中,扩张基因家族富集在核小体装配、染色质组织、蛋白质分解代谢过程、细胞凋亡过程和对氧化应激的响应等通路;几丁质分解代谢过程和脂质代谢过程中显示出显著收缩的基因家族(图3b)。

蝶蛹金小蜂及其他12中代表性膜翅目昆虫系统发育分析。
毒液是影响寄生蜂成功寄生宿主的最重要工具之一。寄生蜂毒液包含许多生物活性化合物,可以操纵宿主的代谢和基因表达,从而为幼虫创造合适的环境。本研究对蝶蛹金小蜂基因组中的毒液蛋白编码基因进行了注释,研究了70个已被鉴定的毒液基因在染色体上的位置和分布。大多数毒液基因(52)散布在基因组中,不会串联排列;但是,涉及串联重复的三个毒液基因家族出现在三个不同的染色体上,表明可能由于串联重复而扩大了基因家族。
进一步的研究发现蝶蛹金小蜂基因组中P450基因的极显著扩张(图4)。蝶蛹金小蜂P450基因的扩张可能进化为用于克服宿主体内的不同代谢产物,例如植物来源的毒素和杀虫剂;也可能与其多样的寄主范围有关。

                                                 图4蝶蛹金小蜂中细胞色素P450基因

本研究是昆虫高质量基因组组装研究的极好范例,并将为寄生蜂分子生物学、系统进化及生物防治研究提供有价值的资源。

武汉希望组医学实验室升级Sequel II平台,进一步拓展新冠病毒变异监测与精准医学领域的产品开发与应用

2020622日,武汉希望组医学实验室成功升级Sequel II测序平台,这标志着希望组(GrandOmics)成为了可以提供全平台三代测序的服务提供商(PacBio Sequel IIONT PromethION 48Bionano Saphyr )。希望组将利用所拥有的多平台组合与自主研发的三代测序算法、软件,继续拓展三代测序技术在病毒基因组变异检测、动植物基因组近完成图、遗传性疾病诊断与筛查、肿瘤诊断与筛查等领域的应用,进一步扩大公司在三代基因测序服务领域的优势,为客户提供更全面、更优质的服务。

作为三代测序技术与应用的开拓者,希望组早在2012年就启动了三代测序研发工作,并于2013年3月11日正式成为中国首家三代测序服务公司。2016年率先在国内引进PacBio Sequel测序平台,成为了三代测序在基因组组装领域的推动力量。2017年3月11日,希望组再次引进5台Sequel平台,一举成为当时全球最大PacBio数据生产中心之一。
希望组本次升级最新的Sequel II平台,是希望组专注三代测序领域应用拓展的战略延续。PacBio HiFi Reads是目前全世界唯一成熟的兼顾长读长与高准确度测序技术的里程碑式的技术创新,是所有三代测序技术开发者梦寐以求的技术工具,希望组整合该技术平台,必将在动植物基因组近完成图、基因组结构变异检测、遗传性疾病诊断与筛查等领域发挥独特的作用。当前,新冠疫情在全球肆掠,利用兼顾长读长和高准确性的HiFi Reads进行新冠病毒变异监测,将会为科技抗疫谱写崭新的篇章。

Sequel II测序仪及SMRT Cell 8M芯片

Science Advances |昆明动物研究所等多单位的合作研究揭示 脊椎动物异源多倍体亚基因组演化的动态历史

以下内容转载自 动物进化与遗传前沿交叉卓越中心,作者 罗 静
多倍化现象在脊椎动物中极为罕见;多倍体脊椎动物在多倍化发生和其后的二倍化进程中可能经历基因组休克效应。但对于相关演化遗传机制是什么、机制是否相同等问题,存在不同假说和许多尚待澄清的问题(PNAS 2016及其他文献)。在张亚平院士领导下,云南大学省部共建云南生物资源保护与利用国家重点实验室罗静教授、中科院昆明动物研究所吕雪梅研究员、湖南师范大学刘少军院士、南京农业大学陈增建教授、中国农业科学院农业基因组研究所阮珏研究员和厦门大学徐鹏教授等带领的团队联合攻关,以鲤亚科鱼类基因组为研究对象,对脊椎动物异源多倍体基因组的亚基因组演化问题进行了深入的研究。
由于鲤亚科鱼类在演化历史上可能经历了四轮之多的全基因组加倍事件,染色体数目达到约100条之多,且其第四轮全基因组加倍事件是伴随一次远缘杂交事件发生(Ma et al.2014.CurrMol Med),而这一类群的二倍体直系祖先均已灭绝,这为鲤亚科鱼类基因组的测序、组装和亚基因组鉴别引入巨大的难度(Xu et al. 2015.NatGenet; Xu et al. 2019.Nat Commun; Yang et al. 2016. BMC Biol.; Chen et al. 2019.Sci Adv)。团队合作通过利用长读长三代测序、Bionano光学图谱和染色质构象捕获测序技术对红鲫(goldfish, Carassius auratus red var.)基因组进行从头组装,获得50条染色体的单倍型参考基因组,完整性和准确性均高于近期发表的金鱼、鲤鱼基因组。同时基于鲤亚科、鲃亚科、裂腹鱼亚科代表物种的线粒体基因组和全基因组标记的系统发育树构建和比较,首次成功对红鲫两个亚基因组的母系和父系亲本来源进行了清晰的划分。
通过重建鲤亚科鱼类的多倍化演化历史,发现鲫鱼、鲤鱼和金线鲃共同起源于13.8~15.1百万年前的一次古异源多倍化事件。比较基因组学和多组织、多胚胎发育时期转录组和DNA甲基化的比较分析结果表明,红鲫与异源多倍体植物和爪蟾基因组中非对称的演化模式呈现明显不同:1)红鲫的父系和母系来源的亚基因组均没有显著的大规模非对称性丢失和演化速率偏向性,两个亚基因组在整个二倍化进程中一直经历交替的非对称性功能丢失;2)虽然两个亚基因组的同源基因对总体呈现平衡表达,有趣的是,两个基因拷贝随胚胎发育时间的推进发生表达优势的切换;3)同源基因拷贝的表达与DNA甲基化的变化呈负相关,但甲基化并不能解释同源基因对在胚胎发育进程中的表达优势切换模式,这提示可能存在更复杂的调控机制决定同源基因对的表达。以上结果说明异源多倍体物种的演化策略具有多样性。在多倍化之后的二倍化进程中,鲤亚科鱼类具有其独特的演化策略,以平衡亚基因组的稳定和多样化。这为研究异源多倍体脊椎动物的基因组演化和功能提供了新的思路。
该工作以“From asymmetrical to balanced genomicdiversification during rediploidization: subgenomic evolution in allotetraploidfish”为题发表在期刊Science Advances(https://advances.sciencemag.org/content/6/22/eaaz7677),云南大学的罗静教授,博士后柴静,中科院北京基因组研究所的博士生文艳玲,湖南师范大学的陶敏博士,云南大学的博士生林国亮为共同第一作者,张亚平院士、吕雪梅研究员、刘少军院士、陈增建教授、阮珏研究员和徐鹏教授为共同通讯作者。希望组科技服务在本研究中提供了PacBio、Bionano测序,基因组组装服务。
该研究得到了国家自然科学基金委、云南省科学技术厅、农业部现代农业体系建设专项资金、湖南省科技重大专项课题、第二次青藏高原综合科学考察研究、中国科学院“西部之光—西部引进人才”项目、博士后创新人才支持计划、中国博士后科学基金的支持。

1 红鲫基因组组装质量比较、共线性及鲤亚科鱼类多倍化演化历史重建。(A)本研究组装的红鲫基因组与前人发表的基因组共线性分析,提示光学图谱和Hi-C数据的辅助组装提升了多倍体基因组序列的连续性和准确度;(B) 红鲫与鲤鱼的亚基因组共线性分析结果;(C) 基于系统发育关系重建鲤亚科基因组的异源多倍化演化历史;(D) 基于单拷贝直系同源基因构建的物种树。

项目文章|Nanopore测序破译栽培桑树基因组,解决桑树物种分类、染色体组倍性争议,揭示湖桑起源之谜

516日,西北农林科技大学蚕桑丝绸研究所、动物科技学院和西南大学家蚕基因组生物学国家重点实验室、蚕学与系统生物学研究所等多家单位联合在Molecular Plant在线发表题为“Chromosome-level reference genome and population genomic analysis provide insight into the evolution and improvement of domesticated mulberry (Morus alba L)”的论文,首次报道了栽培桑树的高质量参考基因组,明确了栽培桑树为二倍体,在分子水平对桑树种质进行重新分类,并提出湖桑品种起源的新见解。该研究是桑树学研究的重大突破,为桑树进化、性状改良和功能基因研究提供了理论基础,改变了桑树基础研究进展迟滞的局面,为解决生产瓶颈问题提供了理论依据。西北农林科技大学焦锋副教授,博士生罗荣松、代学雷和刘慧为共同第一作者,西北农林科技大学钱永华教授、姜雨教授和西南大学赵爱春教授为共同通讯作者。希望组科技服务为本研究提供了NanoporeHi-C测序服务。
栽培桑树白桑(Morus alba)的染色体倍性是一个存在广泛争议的问题,早在20世纪初有研究认为白桑是二倍体,具有28条染色体(2n=2x=28),而2013年野生种川桑基因组公布,川桑为包含14条染色体的二倍体,据此有学者推测栽培桑树是四倍体,染色体基数为7 

1 “荷叶白”的植物形态、核型分析和基因组组装结果。

研究者选择栽培桑树“荷叶白”(又名湖桑32号)为研究对象(图1ABC)。核型分析表明,栽培桑树“荷叶白”的体细胞有丝分裂过程和花粉母细胞减数分裂过程中,28条染色体形成规则的14对二价体(图1D)。利用Nanopore+短读长+Hi-C策略进行基因组测序和组装,最终获得了基因组大小为346.39 Mbscaffold N5022.87 Mb的栽培桑树基因组(图1E)。利用该高质量基因组进行系统发育树构建,发现野生川桑和栽培桑树分化时间已有10.1个百万年(图2A)。与葡萄和桃树基因组共线性分析发现,栽培桑树基因组除了具有双子叶植物共有的γ古六倍化事件之外,没有新的全基因组加倍(WGD)事件发生。因此,栽培桑树基因组为二倍体,并非来源于野生川桑基因组的同源或异源加倍。

2 A)白桑(Morus alba)与川桑(M. notabilis)的分化距离在~10.1个百万年左右,(B)白桑与葡萄(Vitis. vinifera)和桃(Prunus persica)基因组共线性分析。

现有栽培桑树按照形态学特征分为白桑、鲁桑、山桑、广东桑和瑞穗桑五个种,并不能真实反映桑树品种之间的系统发育关系。本研究收集了132分栽培桑树种质(除广东桑外)进行重测序,获得了14.27Mb的单核苷酸多态性(SNP)数据,利用该数据构建系统发育树,没有得到与形态分类相似的聚类结果,在分子水平将白桑、鲁桑、山桑和瑞穗桑这4种栽培桑树种鉴定为同一物种,即白桑(Morus alba L)。

3 134份桑树种质资源的群体结构、核酸多样性分析

群体结构分析将134份栽培桑树种质划分为三个大群:中国湖桑群体,中国北方和西南群体,日本群体(图3A)。系统发育和主成分分析均表明中国桑树群体与日本桑树群体遗传距离较远,湖桑与来自于北方和西南地区的桑树具有明显的分化距离(图3BCD)。遗传多样性分析显示,湖桑的遗传多样性只有其他群体的一半,有强烈的人工选择痕迹。因此,太湖流域的湖桑与其他桑树群体在更早时期就已分开,成为一个独特的品种支系。同时自唐代以来,我国桑蚕业核心区域南移,湖桑作为独立种质资源受到了江南人民持续有目的的选育。这与崧泽遗址的孢粉学研究和吴兴钱山漾考古学证据可以相互印证。

总之,本研究利用Nanopore测序和Hi-C技术首次报道了栽培桑树白桑“荷叶白”的参考基因组,并证实28条染色体的栽培桑树属于二倍体。首次用基因组数据明确了栽培桑树物种分类,认为白桑、鲁桑、山桑和瑞穗桑都属于一个物种,即白桑(Morus alba L)。同时本研究还证实,分布于江浙地区的湖桑是经过长期的强烈人工选择之后形成的一个独特品种支系,阐明了湖桑的起源进化关系。本研究为桑树进化、性状改良和功能基因研究提供了理论基础,改变了桑树基础研究进展迟滞的局面,为解决生产瓶颈问题提供了理论依据。

奋斗的青春-希望组青年突击队助力武汉新冠核酸筛查“十天大会战”

5月11日,武汉市新冠肺炎疫情防控指挥部紧急决定,在全市范围内开展全员新冠病毒核酸筛查“十天大会战”,计划在10天以内对全市1000多万人进行新冠核酸筛查。这是一场全民大检查,关系到每个单位、每个家庭、每个人员的健康与安危。一座千万人口的特大城市,发起了对新冠病毒的最后一战。作为位于武汉的本土企业,希望组时刻牢记社会责任和使命,再次勇挑重担,迅速组织一支百余人的青年突击队,全力以赴迎战“十天大会战”。

本次核酸检测大会战时间紧、任务重、范围广;对样本的接收、运输以及实验环节的管理都是巨大挑战。希望组迅速组织起一支百人突击队,从仪器准备、物料采购、人员培训及分时排班等多方面进行科学合理的资源调配,并进一步加强实验室质量控制(希望组医学检验实验室通过全国新冠病毒核酸检测室间质量评价),从而保质保量完成任务,服务好武汉抗疫大局。

本次希望组青年突击队的成员绝大多数是“八零后”“九零后”,但是突击队成员积极向上的精神和昂扬的斗志,自信的笑容感染了参加大会战的每一个同事。穿着厚重的防护服,长达八小时的连续工作不吃不喝,并没有打垮大家的战斗欲望,突击大队三班倒,保证样本录入、核酸提取、样本检测24小时不停歇,单日检测样本峰值达到了4万人份以上。

在提升检测能力的同时,我们也丝毫不放松质量控制。2020年3-4月,希望组陆续满分通过国家和省级新冠病毒核酸检测室间质评活动,也针对此次大会战制定了专门的质量控制措施,通过科学设计检测流程,严格控制运行环节,确保每一份检测结果的可靠性。大会战期间武汉市、区各级卫建委及相关部门多次进行现场监督检查,对希望组科学的检测流程、严格的生物安全防护、高效的检测速度给予肯定。

 
5月24日,武汉新冠核酸筛查“十天大会战”接近尾声,希望组也交出一份优异的答卷。连续10天不间断运行,希望组累计检测样本量超20万份,单日最高检测量达到了4.1万份!每一份检测结果都凝聚着希望组成员的汗水,为武汉市民重启新的生活做出自己应有的贡献!

希望组线上课堂|三代测序基因组、转录组前沿应用

2020.5月6日-25日每周一、三、五晚8点-9点
希望组线上课堂来了!5月6日-25日,每周一、三、五晚8点-9点,为大家带来三代测序技术在复杂基因组组装、全长转录组、单细胞转录组等研究领域的前沿应用分享,课程内容涵盖实验技术、分析方法、研究策略等,干货满满,不容错过!
讲师风采
王洋
 
毕业于清华大学生命科学学院,师从国际知名分子遗传学家薛定教授,于2016年获得博士学位,并以一作身份在Nature Communication等杂志上发表文章,在分子生物学、细胞生物学、遗传学、基因组学等领域拥有丰富的科研经验,精通各种生物学常见实验技术手段。深度理解Oxford Nanopore、PacBio及Bionano平台的技术特点、应用场景及各种实验方案。
胡江
 
希望组科技服务生信研发总监 具有近十年高通量数据分析的经验,熟悉常用生物信息学软件、数据库,并精通Python,C、R以及高通量数据分析常见算法、流程,主持开发基于三代数据的组装NextDenovo以及矫正NextPolish软件,参与发表10多篇包括Nature Genetics 、Nature Communications、Science在内的文章,专注于三代测序技术在基因组学及转录组学的应用。
梁帆
 
毕业于武汉大学,从事生物信息研发和分析工作近十年,参与多项基因组学,转录组学和群体遗传学项目的数据分析工作。2011年起,参与人类群体和植物群体的分析工作;2014年起,参与三代测序在基因组、转录组、微生物多个方向的应用研发和分析工作;2017年起参与三代测序在遗传病、肿瘤方向的应用研发和分析工作。项目成果文章20余篇,先后发表在Nature Genetics、Developmental Cell等杂志上。
刘雷
 
武汉大学遗传学博士,多年三代测序行业经验,主导并参与多项基因组学,转录组学研究项目设计与技术支持工作,以共同作者和主要参与者发表的项目成果SCI文章10余篇。
吴双菊
 
希望组生产实验部门负责人,毕业于武汉大学药学院,生物化学与分子生物学博士。主要负责ONT(Oxford Nanopore Technologies)平台新产品研发及产品优化,包括ultralong测序、微量建库、全长转录组测序、RNA直接测序等产品的研发及流程优化。
李净净
 
2013年硕士毕业于深圳大学,曾任华大基因算法工程师,参入原CG平台LFR组装软件开发。国内早期从事基于Long Reads(Pacbio/Nanopore/Bionano/Hi-C)平台项目执行、产品推广,拥有丰富的动植物基因组项目实战经验。
孙宗毅
 
希望组科技服务全国销售总监,具有近5年的组学数据分析经验,熟悉常用生物信息学软件、数据库,并精通Python、Perl语言和基因组组学分析算法、流程,擅长处理复杂基因组、超大型基因组组装问题。
汤冬
 
希望组科技服务转录组生信分析主管,毕业于南京农业大学,致力于转录组方向的生物信息分析,有丰富的全长转录组和单细胞分析经验,精通各类测序平台数据特点,近两年以来主攻ONT(Oxford Nanopore Technologies)平台的转录组数据的应用。
封力
 
希望组科技服务资深生信分析工程师。生物化学与分子生物学硕士,长期从事转录组分析,精通二代RNA-Seq、全长转录组分析流程及方法,开发了多种转录组分析流程。

Bionano 光学图谱,真实之美!

Bionano Saphyr 光学图谱作为基因组学研究的重要工具,其关键技术DLS标记(Direct Label and Stain)能够在不产生任何物理损伤的情况下,完成基因组DNA标记,从而获得完整、真实的超长DNA标图谱,分子N50长度最高可达300kb以上!
“眼见为实”的DNA景观

Bionano光学图谱展现了天然DNA分子的真实景观。利用SP DNA分离试剂盒获得超长DNA分子,用直接标记染色法(DLS)进行无损荧光标记,通过纳米微流控芯片将每一条DNA分子线性化展开,并进行高分辨率荧光成像,为基因组学下游应用提供原始DNA景观。这一真实的基因组物理图谱,为基因组组装提供了染色体尺度的框架,并能高效检测到大片段纯合子和杂合子结构变异。

混合组装高质量基因组,Scaffold百倍提升!

Bionano光学图谱提供了基因组染色体级别的宏观框架,可以对Nanopore或PacBio测序拼接的Contig序列,进行排序和定位,并准确估计相邻Contig gap长度,同时可以识别并纠正Contig组装中潜在的错误连接,生成高质量的Scaffold序列。

1 Bionano光学图谱与Contig序列混合组装。利用从头组装的Bionano光学图谱对Contig序列进行排序定位。

混合组装将最初的数千个Contigs缩减至少量Scaffold,提高了组装的准确性和质量,显著改善组装基因组的连续性。希望组基于Bionano saphyr Gen2平台数据能够将组装基因组Scaffold N50提升至124.65Mb,提升效果高达121倍!

校正Hi-C组装错误

Hi-C技术能够将短的序列Contig连接到染色体长度的Scaffold上。然而,这种高度随机的基于核内染色质交联频率的统计方法,在Contig排序和定向上有大量的错误。Bionano光学图谱可以帮助识别并纠正这些错误(图2)。

某植物Hi-C基因组组装与Bionano光学图谱比对。Bionano光学图谱可以识别出Hi-C装配过程中错误定位的5Contigs。在差异区域,长读测序技术与Bionano结构一致,进一步支持Bionano装配的准确性。

检测基因组结构变异

Bionano光学图谱可以利用单分子荧光标记检测结构变异,包括平衡易位、重复扩张、侧翼重复,甚至是大片段重复的重排,能够特异性展示基因组真实结构(图3)。

图3 Bionano光学图谱(蓝色)与参考序列(绿色)比对检测基因组结构变异。

希望组在2019年引进高通量Bionano Saphyr Gen2平台,目前Gen2平台数据产出稳定,已完成上百个辅助基因组组装和结构变异检测项目。希望组科技服务“感恩回馈,服务增值”活动火爆进行中,新签订Bionano Gen2测序项目即可获赠Nanopore测序或Hi-C文库。

活动详情咨询当地科技顾问,或邮件联系sales-support@grandomics.com,希望组科技服务,为您的科研之路保驾护航!

马尾松毛虫——首个枯叶蛾科昆虫染色体水平基因组

近日,中国林业科学研究院森林生态环境与保护研究所、首都师范大学、中国科学院植物生理生态研究所、希望组科技服务等多家单位,联合在Molecular Ecology Resources期刊发表题为”Chromosome-level genome assembly of an important pine defoliator,Dendrolimus punctatus (Lepidoptera; Lasiocampidae)”的研究论文。该研究利用三代测序技术结合Hi-C技术组装出马尾松毛虫染色体水平基因组,为这一重要林业害虫的生物学过程、功能与进化研究提供了重要遗传资源。中国林业科学研究院森林生态环境与保护研究所张苏芳副研究员为第一作者。中国林业科学研究院森林生态环境与保护研究所张真研究员,首都师范大学生命科学学院张爱兵教授,中国科学院植物生理生态研究所黄勇平研究员、詹帅研究员,以及希望组韩玲玲博士为共同通讯作者。希望组彭炯、任平平为本研究共同作者。希望组承担了该研究中三代测序、组装和部分分析工作。

松毛虫(Dendrolimus是鳞翅目、枯叶蛾科、松毛虫属的统称,是发生量大、危害严重的主要森林害虫。其中的典型代表,马尾松毛虫(Dendrolimus punctatus)幼虫取食松针,爆发期间连片松林数日内被蚕食精光,远看枯黄、焦黑,如同火烧一般,常称为“不冒烟的森林火灾”,给林业生产造成重大的经济损失。然而,从分子生物学角度对松毛虫成灾机理方面的探索比还较少,限制了我们深入理解其成灾的内部分子机理。因此,亟待从其本身的遗传和基因组角度深入探究松毛虫的成灾机制,才能形成更加有效的可持续控制体系。

马尾松毛虫生活史。(a)  (b) 幼虫 (c)  (d) 雌性成虫 (e) 雄性成虫

本研究以自然群体中马尾松毛虫雌性成虫为样本,k-mer分析显示基因组大小约为596.1Mb,杂合度1.70%,属于高杂合基因组。随后,利用PacBio测序技术结合Hi-C染色体构象捕获技术,组装出包含30条染色体的马尾松毛虫高质量基因组。最终版本基因组大小为614 Mbcontig N501.39 Mbscaffold N50 22.15 MbHi-C挂载率为 96.96%。组装基因组质量评估发现,99.7%的短读长数据会比至基因组,BUSCO完整性评估达到96.4%,表明组装出的马尾松毛虫基因组序列完整、错误率低。研究者将马尾松毛虫分别与两个鳞翅目昆虫(斜纹夜蛾、家蚕)基因组进行比较,基因共线性程度高,符合前人提出的鳞翅目昆虫基因位点或共线性排序相似的研究结论,再次证实马尾松毛虫的高质量基因组。马尾松毛虫基因组共注释到17,593个蛋白编码基因,其中15,914个基因获得了功能注释,重复序列占全基因组的56.16%

马尾松毛虫染色体水平组装。(a) 马尾松毛虫Hi-C热图。 (b) 马尾松毛虫与斜纹夜蛾基因组共线性图。 (c) 马尾松毛虫与家蚕基因组共线性图。
利用马尾松毛虫与其他11种昆虫的1,170个单拷贝直系同源基因构建系统发育树。小菜蛾(P. xylostella)位于鳞翅目昆虫进化枝的最基部,马尾松毛虫与家蚕亲缘关系最接近,并可能与美国白蛾额、斜纹夜蛾、松异舟蛾的共同祖先在108.91百万年前发生分化。发生分化后,马尾松毛虫有2,104个基因家族发生扩张,1,900个基因家族收缩。扩增的基因家族中与外源化合物降解和解毒系统相关的基因显著富集。

马尾松毛虫与其他11种昆虫的系统发育树

随后研究者在马尾松毛虫基因组中鉴定了与解毒相关的基因家族,并与其他鳞翅目昆虫的相似基因家族进行了比较。马尾松毛虫中共鉴定到132P450基因,转录组数据显示编码P450的基因表现出幼虫偏倚的表达模式。马尾松毛虫中P450基因家族的CYP3族相比家蚕有明显的扩张,既往研究表明,CYP3家族成员参与了外源化合物代谢和杀虫剂抗性,并与宿主植物的某些防御化学物质的耐受性有关。马尾松毛虫CYP3家族基因进化扩展和幼虫期表达偏倚可能与对松针抗性化合物的耐受性有关。

4 (a)P450基因在马尾松毛虫四个发育时期表达情况。(b) 马尾松毛虫(红点)与家蚕基因组中P450基因的三个族。

高质量的马尾松毛虫基因组将为在基因组水平研究这一重要林业害虫的各种生物学过程提供机会,并将为马尾松毛虫和其他枯叶蛾科昆虫的功能和进化研究提供有价值的资源。

Nature index:2020年自然指数年度榜单 希望组勇夺中国测序行业第二名

4月30日,Nature Index网站更新了最新的自然指数排名(统计自2019年1月1日至2019年12月3 […]