再次突破!希望组自动化Hi-C纠错挂载流程实现大型基因组染色体水平组装

继攻克大型基因组组装难题后,希望组科技服务开发出自动化Hi-C纠错挂载流程,不仅能纠正组装序列的错误,还解决了大型基因组Hi-C挂载错误多,难以人工校正的问题,实现大型基因组从草图到染色体水平组装的全流程技术突破。

目前,利用Hi-C技术将基因组草图序列高精度地定位到染色体,并确定其在染色体上的顺序和方向,构建出染色体水平基因组,已经成为动植物基因组de novo组装的标准配置。然而,某些具有大型基因组的物种很难获得染色体水平的基因组,一方面,大型基因组草图组装难度大,已经发表的大型基因组,组装指标普遍较低,Contig N50多在Kb级别;另一方面,碎片化的大型基因组草图,导致Hi-C挂载率普遍不高组内错误较多,并且几乎无法通过人工方式进行调整。缺少染色体级别的基因组序列,严重阻碍了大型基因组染色体进化、比较基因组及三维基因组研究工作。

针对大型基因组组装问题,希望组基于NextDenovo自主组装算法结合纳米孔测序的超长读长优势,已完成了多个10Gb以上大型基因组的测序组装工作,获得的大型基因组的Contig N50均在Mb水平,基因组完整性也较高,为实现染色体水平的组装奠定坚实基础。

基于高质量的基因组草图,大型基因组的Hi-C挂载率提升明显(95%以上),但是热图显示组内挂载错误较多(图1)。使用传统的软件或人工可以对比较小的基因组进行Hi-C热图校正,但是大型基因组几乎无法采用这种方法。

图1 某大型基因组Hi-C初始挂载热图(左)和自动化纠错、校正后的Hi-C热图(右)

为此希望组开发出自动化Hi-C纠错挂载流程,可以进行Hi-C互作热图绘制展示和组装结果调整,从图形上快速校正已有组装的错误。某大型基因组经过自动化Hi-C纠错、校正以后组内错误得到了极大改善,热图中邻近的序列间(对角线位置)交互强度高,而非邻近的序列之间(非对角线位置)的交互信号强度弱,在对角线以外区域没有明显的噪音(较强交互强度),证明基因组组装效果较好(图1)。

大型基因组的测序和组装仍是世界性难题,希望组通过自主研发NextDenovo组装算法、攻克纳米孔超长测序瓶颈、开发自动化Hi-C纠错挂载流程,最终实现大型基因组从草图到染色体水平组装全流程的技术突破。这是希望组在基因组组装领域持续深耕多年的技术实力的集中体现。

对大型基因组组装感兴趣?

请联系希望组当地科技顾问,或发送邮件至sales-support@grandomics.com。

希望组科技服务,为您的科研之路保驾护航!

N50提升121倍!希望组Bionano Gen2辅助组装实力展示!

 

希望组在2019年引进Bionano新版Saphyr Gen2平台,目前Gen2平台数据产出稳定,辅助基因组组装N50提升可达121倍,效果惊艳!

Bionano Gen2平台采用最新版本纳米微流控芯片,单张芯片具有三个FlowCell,每个FlowCell产出高达1300Gb,每张芯片理论上可获得最高3.9Tb的数据。希望组多个项目实测数据均能达到1300Gb,每100Kb平均标记数量在13个以上,有效数据N50在240Kb以上,数据产量和质量完全满足后续分析需求。

希望组Bionano Saphyr Gen2实测数据展示


Bionano提供真实的DNA物理图谱,能够有效解决复杂动植物基因组组装中出现的错误,同时大幅度提升组装版本连续性,甚至实现染色体水平组装。希望组基于Bionano Gen2数据能够将组装基因组scaffold N50提升至124.65Mb,提升效果高达121倍!

 

希望组BionanoGen2辅助组装项目案例

BionanoGen2数据通量提升至Tb级别极大拓展了其应用范围,在动植物基因组研究领域完美适配大型基因组,在医学研究中可用于人类面肩肱型肌营养不良症(FSHD)的诊断。
为回馈广大客户,希望组隆重推出服务增值活动:即日起,体验Bionano Saphyr Gen2平台,即可获赠ONT PromethION芯片免费测序和免费Hi-C文库增值服务。

活动详情咨询当地科技顾问,或邮件联系sales-support@grandomics.com,希望组科技服务,为您的科研之路保驾护航!

庆五一,迎开学,希望组三代测序感恩大回馈!

庆五一迎开学,希望组三代测序感恩大回馈!

风雨洗礼后的中华大地生机无限,史上最长寒假也终于接近尾声,全国各地高校陆续发布了师生返校安排。自疫情发生以来,全国人民精诚团结,倾力支援武汉,谱写了中华民族一首首感人肺腑的诗篇!作为一家位于湖北武汉的科技服务型公司,我们也感念于全国客户多年以来的大力支持,借此机会,希望组科技服务正式开启“感恩回馈,服务增值”活动,回馈全国高校、科研单位老师同学,让科研基金尽其所用,助力您的新学期科研工作加速开展!

活动详情咨询当地科技顾问,或邮件联系sales-support@grandomics.com,希望组科技服务,为您的科研之路保驾护航!

第二弹—希望组2020三代基因组文章集锦-动物篇

动物基因组一直以来都是组学研究领域的热门,近年来越来越多的动物基因组研究极大地推动了人们对于人类起源、物种演化、医学、病虫害防治及濒危动物的保护等方面的认知及研究。今年以来希望组多平台动物基因组研究也是成果丰硕,下面就由组学君给大家分享几篇昆虫和水产方向案例文章,与您一起探讨动物基因组的奥秘!
重要农业害虫温室白粉虱
Chromosome-level genome assembly of the greenhouse whitefly (Trialeurodes vaporariorum Westwood)合作单位:中国农业科学院蔬菜花卉研究所发表期刊:Molecular Ecology Resources

影响因子:7.049

发表日期:2020.03.27

三代测序平台:PacBio Sequel

温室白粉虱(Trialeurodes vaporariorum Westwood)与烟粉虱是两类分布广泛、危害严重的农业害虫,能够危害蔬菜、花卉、果树等112个科653种植物,并且对多种杀虫剂具有抗性。目前已有多个烟粉虱基因组被测序组装,而白粉虱仍缺少高质量的参考基因组。本研究利用Illumina+PacBio策略组装出787.4 Mb的白粉虱基因组,随后利用Hi-C数据将778.0 Mb (98.8 %)的序列挂载至11条假染色体(Scaffold N50=70Mb, BUSCO 93.4%)。系统发育分析表明白粉虱与烟粉虱在87.27百万年前(Mya)发生分化,远早于烟粉虱不同生物型的分化时间。白粉虱与烟粉虱的比较基因组分析发现,4个天冬氨酸蛋白酶家族在白粉虱基因组中有显著扩张,可能与其特有的寄主偏好性有关。白粉虱与烟粉虱基因组之间有13个P450基因存在共线性,并且白粉虱基因组中细胞色素CYP6亚家族中的4个基因表现出显著的扩张,这些基因可能在白粉虱对新烟碱类化合物的代谢和抗药性中起重要作用。本研究公布的高质量白粉虱基因组,为粉虱科农业害虫的害虫抗性管理和抗药性研究提供了重要资源。

图1温室白粉虱与烟粉虱不同生物型基因组关键指标比较

中国特有鱼类黑尾近红鲌
High-quality genome assembly and transcriptome of Ancherythroculter nigrocauda,an endemic Chinese cyprinid species合作单位:九江学院药学与生命科学学院发表期刊:Molecular Ecology Resources

影响因子:7.049

发表日期:2020.03.26

三代测序平台:PacBio Sequel

黑尾近红鲌(Ancherythroculter nigrocauda)属于鲤科近红鲌属,是我国特有物种和重要的长江经济鱼类。黑尾近红鲌迄今尚未有参考基因组,限制了对其生物学特性的深入分析以及优质种苗的选育。研究者利用Illumina+PacBio策略装出1.04Gb的黑尾近红鲌基因组,contig N50为3.12Mb。结合Hi-C数据将97.2%序列挂载到24条染色体上,BUSCO数据库评估该基因组完整性为95.6%。注释结果显示,黑尾近红鲌基因组共预测到34,414个蛋白编码基因,其中27,042个基因(78.5%)得到功能注释,含有56.1%转座子序列。随后研究者利用12个脊椎动物基因组中的712个单拷贝直系同源基因构建系统发育树,发现黑尾近红鲌与武昌鱼亲缘关系最近并于8.79百万年前分化。黑尾近红鲌与普通鲤鱼、武昌鱼、草鱼、斑马鱼和日本青鳉的比较基因组分析发现,黑尾近红鲌基因组中有366个基因家族发生了扩张,有72个正向选择基因。大部分扩张基因家族和正向选择基因在黑尾近红鲌脑部高表达,表明这些基因可能在黑尾近红鲌的大脑发育中发挥重要作用。转录组数据分析发现,在黑尾近红鲌10个组织中,与环境信息处理、循环系统和生长发育等相关的10,732个基因的表达具有组织特异性。该高质量基因组为黑尾近红鲌种群保护及功能基因组学研究提供了宝贵资源。

图2 黑尾近红鲌24条染色体Hi-C热图

法医昆虫学重要物种巨尾阿丽蝇
Chromosome-level genome assembly of Aldrichina grahami, a forensically important blowfly合作单位:中南大学基础医学院发表期刊:GigaScience

影响因子:4.688

发表日期:2020.03.19

三代测序平台:PacBio Sequel

巨尾阿丽蝇(Aldrichina grahami)是重要的法医昆虫学物种,它的生长发育速度和生命周期可以为死亡时间推断提供重要信息;其肠道内容物中提取的人类DNA物质,可以为案件侦破提供新的切入点和线索。巨尾阿丽蝇基因组尚未公布,这阻碍了它在法医研究中的进一步应用。本研究利用PacBio+Hi-C策略组装出包含6条染色体的巨尾阿丽蝇基因组,contig N50 为1.93 Mb,基因组完整性评估BUSCO达到了99.2%,基因组连续性与完整性均高于其他4个双翅目有瓣蝇类。基因组注释发现,巨尾阿丽蝇基因组包含48.02%的重复序列,共预测到12,823个蛋白编码基因,其中99.8%的基因获得功能注释。利用11个物种的2,989个单拷贝基因进行系统发育分析,巨尾阿丽蝇与铜绿蝇聚在同一分支,并且在约26百万年前分化。基因家族分析表明,巨尾阿丽蝇有102个扩张的基因家族和280个收缩的基因家族,还有198个基因家族在基因组中丢失。最后研究者绘制了巨尾阿丽蝇与黑腹果蝇基因组共线性图,以及巨尾阿丽蝇染色体上的基因密度分布图。高质量的巨尾阿丽蝇基因组资源将有助于加深对其独特生物学特征的理解,从而增强昆虫学证据的可靠性,促进其在刑事司法调查中的应用。

图3 (A)巨尾阿丽蝇与黑腹果蝇基因组共线性图;(B)巨尾阿丽蝇染色体基因密度分布图

重要商品蟹三疣梭子蟹
Chromosome-level genome assembly reveals the unique genome evolution of the swimming crab (Portunus trituberculatus)合作单位:盐城师范学院、西北工业大学发表期刊:GigaScience

影响因子:4.688

发表日期:2020.03.26

三代测序平台:Nanopore

梭子蟹(Portunus trituberculatus)是我国重要的商品蟹种,广泛分布于渤海、黄海、东海、南海等沿海水域。过度捕捞导致梭子蟹自然种群大幅下降,目前已开始人工养殖。本研究利用BGISEQ+Nanopore+Hi-C策略组装出三疣梭子蟹染色体水平基因组,为梭子蟹的生殖研究提供重要资源。梭子蟹基因组初步组装大小为1.00 Gb,Contig N50为4.12 Mb,随后结合Hi-C数据组装出梭子蟹的50条染色体,Scaffold N50 高达21.79 Mb,基因组完整性评估BUSCO也达到94.7%。基因组注释发现,约54.52%的基因组被鉴定为重复序列,共16,796个蛋白编码基因获得功能注释。利用覆盖7个物种的1,018个单拷贝基因构建系统发育树,梭子蟹与中华绒螯蟹和对虾亲缘关系较近,分别在约183.5和428.5百万年前发生分化;进化速度方面以梭子蟹为参照,对虾进化速率最慢,果蝇和蝴蝶进化速率相对较快。

图4 梭子蟹的基因组特征圈图

圆点斑芫菁基因组揭示斑蟊素合成通路
Draft Genome of a Blister Beetle Mylabris aulica合作单位:陕西师范大学发表期刊:Frontiers in Genetics

影响因子:3.517

发表日期:2020.01.08

三代测序平台:Nanopore

圆点斑芫菁(Mylabris aulica)属鞘翅目芫菁科,也称为斑蝥。其受到袭扰后能产生一种具有刺激性的防御物质斑蝥素(Cantharidin),具有抗炎、抗病毒、增强免疫调节活性的作用。最新研究表明斑蝥素及其衍生物能够抑制多种类型癌症的增殖,但其人工合成因为条件苛刻一直无法规模化生产。目前对芫菁科昆虫体内斑蟊素的合成机制研究主要是用比较转录组的方法推测可能的相关基因,但代谢通路完全不清楚。研究者利用纳米孔测序技术组装出288.5Mb的圆点斑芫菁的基因组,scaffold N50为467.8kb,预测的重复序列占50.62%,BUSCO完整性评估达97.9%,相比已经报导的两种已知斑蝥基因组,该组装连续性、完整性都得到了极大提升。根据基因组数据对圆点斑芫菁的遗传背景进行分析,表明圆点斑芫青与其他芫菁科昆虫基因背景几乎完全相同,分化时间也极短。随后研究者在“萜烯类主链生物合成”途径中发现了30个基因家族,它们参与了斑蝥素的生物合成,并且对其中两个功能未知的基因BMGene00496和BMGene01890进行了功能注释。总之,本研究利用纳米孔测序技术组装出了圆点斑芫菁的基因组草图,对斑蝥素生物合成相关的可能基因和途径进行了分析,为后续圆点斑芫菁研究以及斑蝥素生物合成提供了宝贵资源。

图5 圆点斑芫菁相比两个近源斑蝥,基因组连续性和完整性均有大幅度提升。

2020希望组合作文章列表

参考文献:
1. Xie, W.,He, C., Fei, Z. & Zhang, Y. Chromosome-level genome assembly of thegreenhouse whitefly ( Trialeurodes vaporariorum Westwood). Mol Ecol Resour(2020) doi:10.1111/1755-0998.13159.
2. Zhang,H.-H. et al. High-quality genome assembly and transcriptome ofAncherythroculter nigrocauda , an endemic Chinese cyprinid species. Mol EcolResour (2020) doi:10.1111/1755-0998.13158.
3. Meng, F. etal. Chromosome-level genome assembly of Aldrichina grahami, a forensicallyimportant blowfly. GigaScience 9, giaa020 (2020).
4. Tang, B. etal. Chromosome-level genome assembly reveals the unique genome evolution of theswimming crab (Portunus trituberculatus). GigaScience 9, giz161 (2020).
5. Guan, D.-L.et al. Draft Genome of a Blister Beetle Mylabris aulica. Front. Genet. 10, 1281(2020).

硬核爆发-希望组2020三代基因组文章集锦-植物篇

2020年,希望组合作项目好文不断,截止2020年4月,希望组基于三代测序技术的基因组、转录组项目文章已发表17篇,其中不乏Nature Genetics、Nature Plants等高分文章。今天组学君就给大家盘点一下植物方向部分案例文章,为大家解锁发文经典套路!

高质量基因组揭示棉花A亚基因组起源[1]

Genome sequence of Gossypium herbaceumand genome updates of Gossypium arboreum and Gossypium hirsutumprovide insights into cotton A-genome evolution合作单位:武汉大学高等研究院发表期刊:Nature Genetics

影响因子:25.455

发表日期:2020.04.13

三代测序平台:PacBio RSII&Sequel

异源四倍体棉花A亚基因组和D亚基因组的起源一直是科学家想要回答的问题,目前学界公认D亚基因组的供体为雷德蒙氏棉D5,但是A亚基因组的起源仍存在争议,没有确切证据支持其来源于非洲棉A1或亚洲棉A2。本研究利用三代测序技术组装了首个草棉基因组(var. AfricanumA1, n=x=13),并对亚洲棉和陆地棉基因组进行了更新。通过比较基因组分析、基因组进化及群体遗传分析,理清了非洲棉A1、亚洲棉A2和A亚基因组之间的进化关系:A亚基因组与非洲棉A1、亚洲棉A2有着共同的祖先A0(已灭绝),在约1.0−1.6百万年前A0与雷德蒙氏棉D5形成异源四倍体棉花AD,约70万年前A0分化出非洲棉A1与亚洲棉A2(图1)。这一模型的提出结束了许久以来异源四倍体棉花A亚基因组起源的争议,为棉属研究提供了重要理论指导和遗传资源,加快了棉花主要农艺性状的遗传改良进程。

图1 棉花A基因组起源与进化模型(a)和重要进化事件(b)

ONT测序助力攻克首个高质量角苔参考基因组[2]

The hornwort genome and early land plant evolution合作单位:中国科学院植物研究所、福建农林大学、深圳仙湖植物园、比利时根特大学发表期刊:Nature Plants

影响因子:13.297

发表日期:2020.02.10

三代测序平台:Nanopore PromethION

苔藓类包括苔、藓和角苔三大分支,是现存最早的陆生植物,在植物演化过程中代表从水生到陆生的过渡类型。角苔类以其难解的系统位置、独特的形态特征、以及其与细菌、真菌广泛共生的特异现象而备受关注。本研究采用Nanopore+illumina策略,结合系列精细设计的去污染流程,克服细菌内源污染,获得了第一个高质量的角苔参考基因组。通过与其他苔藓植物以及陆生植物的比较基因组分析,确定了苔藓类植物的单系性,角苔是苔和藓的姊妹群,位于苔藓分支的最基部;基因组学分析表明角苔具有与简单的形态结构相适应的低冗余度基因组(图2);基因家族分析发现了其中与RNA编辑、紫外线保护以及逆境响应相关基因家族的扩张;同时角苔还受益于从土壤细菌和真菌转移而来的基因,丰富了其氧化还原、胁迫响应和代谢相关的基因组分。以上一系列研究揭示了角苔这一类群对陆地环境的适应机制。

图2 芽胞角苔与18个绿色植物的比较基因组分析。a, 基于OrthoMCL的基因家族聚类比较。b, 19个绿色植物的基因家族获得(+)/丢失(-)情况比较,红框标注苔藓类群分支。c, 芽胞角苔、小立碗藓和地钱的全基因组加倍事件分析。

高质量油桐基因组,荣登GPB期刊“封面故事”[3]

Tung Tree (Vernicia fordii) Genome Provides AResource for Understanding Genome Evolution合作单位:中南林业科技大学发表期刊:Genomics, Proteomics & Bioinformatics

影响因子:6.597

发表日期:2020.04.07

三代测序平台:PacBio RSII

油桐(Vernicia fordii)为大戟科油桐属落叶乔木,在我国有1000多年的栽培利用历史,是世界性的木本油料树种。本研究选用高纯合体“葡萄桐”为基因组测序材料,采用Illumina+PacBio RSII测序,组装出大小为1.12 Gb油桐基因组,结合Hi-C技术将95.15%的序列被挂载到11条假染色体上。研究者基于高质量油桐参考基因组,进行了一系列数据分析与挖掘。通过比较基因组学揭示了重复序列爆发所驱动的油桐基因组扩张机制;结合17个不同发育阶段的组织/器官的RNA-seq数据,构建了油桐全基因组尺度的可视化表达谱网站;构建了桐油生物合成全景图,探究油脂合成的复杂机制。油桐基因组的破译,具有重要的科学理论价值和广泛的产业应用价值,本研究以“封面故事”的形式发表在《Genomics, Proteomics &Bioinformatics》。

图3 油桐(a)及其基因组景观(b)

白木香—瑞香科第一个染色体水平基因组[4]

Genome sequence of the agarwood tree Aquilariasinensis (Lour.) Spreng: the first chromosome-level draft genome in theThymelaeceae family合作单位:中国热带农业科学院热带生物技术研究所发表期刊:GigaScience

影响因子:4.688

发表日期:2020.03.02

三代测序平台:Nanopore GridION

图4 白木香(a)及其基因组Hi-C热图(b)

白木香(Aquilaria sinensis (Lour.))是传统名贵药材和天然香料“沉香”的重要基源植物,良好的医药价值和巨大的经济效益,导致了对白木香的掠夺式采伐,其野生资源已日渐枯竭。本研究采用Illumina+Nanopore GridION X5 +Hi-C策略组装出首个染色体水平白木香基因组,基因组大小726.5 Mb,scaffold N50为88.78 Mb,BUSCO分析结果为95.2%。单拷贝同源基因的系统发育分析表明白木香与可可树及陆地棉亲缘关系较近,其共同祖先在大约53.18-84.37百万年前分化。白木香高质量基因组的发布,为野生白木香种群保护生物学、沉香结香机制和香味基因及树种的进化研究奠定良好基础。

园艺观赏植物文竹染色体水平基因组[5]

Chromosome-level genome assembly,annotation and evolutionary analysis of the ornamental plant Asparagussetaceus合作单位:河南师范大学发表期刊:Horticulture Research

影响因子:3.368

发表日期:2020.04.01

三代测序平台:Nanopore GridION

文竹(Asparagus setaceus)又名山草、云竹、云片松,有“文雅之竹”的美称,是具有极高观赏价值的园艺植物。本研究采用Illumina+Nanopore GridION X5 +10X Genomics+Hi-C策略,完成了710.15 Mb的高质量文竹基因组,contig N50 为1.36 Mb。分析表明文竹基因组包含28,410个编码基因,其中25,649个(90.28%)获得功能注释,重复序列占全基因组的65.59%,且大部分为长末端重复序列。文竹是雌雄同株植物,其近源种芦笋为雌雄异株,进化分析估算,文竹与芦笋在约9.66百万年前发生分化,并且文竹经历了两次全基因组复制事件。对二者基因组的比较研究为植物性染色体的进化研究提供新的线索。另外研究者在文竹基因组中鉴定到762个特异基因家族,96个正向选择基因和76个抗性基因。文竹高质量基因组的完成为天门冬属植物比较基因组研究提供了新的遗传资源,有利于性染色体的演化及天门冬属的演化研究。

图5 文竹高质量基因组。(a)文竹。(b)基于1002个单拷贝直系同源基因的系统发生树。(c)文竹基因组景观。(d)文竹与芦笋基因组线性比较

铁核桃染色体水平基因组[6]
Chromosomal-levelassembly of Juglans sigillata genome using Nanopore, BioNano, and Hi-Canalysis合作单位:南京林业大学、云南省林业和草原研究院经济林研究所发表期刊:GigaScience

影响因子:4.688

发表日期:2020.02.26

三代测序平台:Nanopore GridION

铁核桃(Juglans sigillata)属于壳斗目胡桃科胡桃属,是我国云南省的重要经济树种。铁核桃与栽培种核桃(Juglansregia)亲缘关系密切,在中国西南部核桃与铁核桃表现出显著的同域分布模式,但是针对铁核桃的分子生物学研究较少。研究人员利用Illumina+Nanopore GridION X5组装出 536.50 Mb的铁核桃基因组草图,利用Bionano光学图谱数据将Scaffold N50提升至16.43 Mb,最后结合Hi-C数据将93%的序列挂载到16条假染色体,组装质量远优于大部分近源种参考基因组。基因组注释共预测30,387个编码蛋白基因,整个基因组的50.06%为重复序列。系统发育分析表明,栽培核桃与铁核桃在约49百万年前发生分化。本研究为胡桃科相关物种的基因组研究以及分子育种提供了宝贵的资源。

图6 铁核桃与其近源种基因组比较

2020希望组合作文章列表
相关阅读希望组项目文章|Nature Genetics高质量基因组揭示棉花A亚基因组起源希望组项目文章|Nature Plants ONT测序助力攻克首个高质量角苔参考基因组

希望组项目文章|Nature Plants 芡实与金鱼藻三代基因组揭示早期被子植物演化

希望组项目文章|中国特有物种黑尾近红鲌高质量基因组

希望组项目文章两连发|三代测序助力药用动物圆点斑芫菁、菲牛蛭基因组草图组装

参考文献:

1.     Huang, G. et al. Genome sequence of Gossypium herbaceum andgenome updates of Gossypium arboreum and Gossypium hirsutumprovide insights into cotton A-genome evolution. Nat Genet (2020)doi:10.1038/s41588-020-0607-4.

2.     Zhang, J., Fu, X., Li, R. et al. The hornwort genome and early landplant evolution. Nat. Plants 6, 107–118 (2020).https://xs.scihub.ltd/https://doi.org/10.1038/s41477-019-0588-4

3.     Zhang, L. et al. Tung Tree (Vernicia fordii) Genome ProvidesA Resource for Understanding Genome Evolution and Improved Oil Production.Genomics, Proteomics & Bioinformatics S167202291830216X (2020)doi:10.1016/j.gpb.2019.03.006.

4.     Ding, X. et al. Genome sequence of the agarwood tree Aquilariasinensis (Lour.) Spreng: the first chromosome-level draft genome in theThymelaeceae family. GigaScience 9, giaa013 (2020).

5.     Li, S.-F. et al. Chromosome-level genome assembly, annotation andevolutionary analysis of the ornamental plant Asparagus setaceus. HorticRes 7, 48 (2020).

6.     Ning, D.-L. et al. Chromosomal-level assembly of Juglanssigillata genome using Nanopore, BioNano, and Hi-C analysis. GigaScience 9,giaa006 (2020).

让生命充满希望!——“希望组”“未来组”品牌整合

2011年8月,我在武汉创立了“武汉未来组”。当时的想法非常简单,从华大基因出来,不偷老东家的“一行代码、一个产品、一个人、一项技术”,独立创业,如果能活着就继续做,如果不行就转行做会计,反正之前还考过注册会计师,注册税务师,应该不难。“未来组”品牌的寓意是:持续推动新的组学技术的发展,一直引领新的组学技术的应用,不停创新,从而创造价值。
2012年10月,我们选择了将“三代测序”作为我们主要的战略方向,从而成为了中国首家三代测序服务公司。从细菌、线粒体、叶绿体基因组完成图开始,逐步拓展到真菌近完成图和动植物基因组精细图,一直到人类基因组高质量参考基因组,我们将基因组组装的技术极限不停的推向前沿,也带动了整个领域的变革。看到现在基因组组装领域,已经基本上完全被三代测序所垄断,当时还是不曾预计到的,这只是三代测序技术基本取代二代测序技术的第一个应用领域,以后也许还会有更多。
2014年,我们成立了“北京希望组”,准备开始涉足精准医学领域,继续拓展三代测序的应用场景。这一次,基本上是在一个无人之境探索,整个世界都没有真正意义上的三代测序精准医学产业,零星的三代测序医学研究已经开始,但是远不是主流。在目睹了一个病友家庭历时七年、为了一种罕见病(多囊肾)的诊断和产前诊断,求医问药,历尽艰辛之后,最后因为我们是三代测序公司而找到了我们,我受到了强烈的震撼,原来疾病可以让人如此的绝望,原来测序技术是可以如此的改变人生,造福人类。“希望组”品牌由此而生,我们想用最新的技术,解决难以解决的问题,从而“让生命充满希望”。
接下来几年,我们一边继续拓展三代测序在动植物领域的应用:开发了NextPolish和NextDenovo系列软件,在国内三代测序基因组组装也算是唯一的拥有自主开发组装软件的公司;引进了Oxford Nanopore技术平台大幅进入动植物组装领域,因为ONT技术的高通量、低成本,大大拓展了动植物基因组组装项目的效率,随着ONT技术的成熟和成本的进一步降低,ONT组装动植物基因组已经成为很多实验室自建平台,独立开展动植物基因组研究的最佳选择。在此基础上,我们又进一步基于ONT平台的Ultra-long Reads技术进行探索,再结合PacBio Sequel II的HIFI Reads技术、Bionano光学图谱、Hi-C技术,将动植物基因组组装也提高到了“近完成图”标准,即将在近期开始推广。
另一方面,我们在三代测序精准诊断领域,也一直在不停的探索与积累:借助PacBio Sequel技术平台,拓展了HLA分型和遗传病诊断Panel的应用,借助Bionano Genomics平台,我们开发了面肩肱肌肉营养不良(FSHD)的精准诊断技术,借助Oxford Nanopore技术平台,我们开发了遗传病诊断、病原微生物快速诊断、辅助生殖诊断技术以及肿瘤基因组诊断Panel,可以说已经全面覆盖了精准医学的方方面面。
然而,无论客户、投资机构、政府部门等行业内外相关者,都对于我们两个品牌感到困惑,让我产生了整合品牌的冲动,尤其是以下一些缘故:
1)2019年有一天,无意中看到一个同行公司的宣传:他们在Nature Index上面行业排名领先,技术如何好,市场如何好,但是,我突然发现原来我们的指标如果把未来组与希望组加起来,其实超过了这家行业领导公司。看起来,原来连Nature也不知道我们“未来组”与“希望组”是一家啊!看起来,我们两个品牌”NextOmics”和”GrandOmics”的分隔,在国际上也引起了困惑。
2)2019年,作为中国的一件大事,就是“香港事件”。期间我一直在思考,为什么会有这样的结果,当然原因有很多,其中一个重要的原因,我个人觉得就是品牌不统一,大陆是“中国”品牌,香港是“香港”品牌。我再看我们自己公司,其实也是一样,一部分是“未来组人”,一部分是“希望组人”,其实也是不统一的,这样的事情,改变一个国家的治理,不是很容易,但对于一个公司来说,还是可以很快调整的。
3)2020年,大家都经历了一次非常魔幻的开局,还没有来得及大干一场,一年的1/4就这样匆匆而过,我们作为发源于武汉,主要的生产基地都在武汉的公司,也积极的投入到了抗疫的工作之中,协助火神山、病毒所等多个单位进行紧急的科技攻关。疫情给我们带来了极大的困难,也给我们带来了难得的机遇,让我们崭露头角,我们趁此机会与301医院一起,开发了借助Oxford Nanopore技术平台的病原微生物快速诊断与生物信息分析平台,大量的成果即将逐步公开。但是,在参加抗疫的过程中,我们感觉很多来自于全国各地的援助国家医疗队也是对我们未来组与希望组两个品牌感到困惑,让我再一次感到了品牌分隔的压力。

疫情之后,一切都改变了。

也许这是一个要改变人类生活方式,生产方式,合作方式的“大历史”事件。

武汉在重启,我们公司也在重装,整个公司将更加聚焦技术创新、应用落地、服务客户、创造价值。为了更好的传递公司的战略、价值观与技术创新,我们在今天:2020年4月13日,正式启动“希望组”与“未来组”品牌统一的工作。以后,将统一使用“希望组”品牌,用于我们的“科技服务”、“诊断服务”、“生物信息”、“诊断产品”四大业务模块。“未来组“品牌将暂时保留到以后的其他业务模块之用。
特作文以记之。汪德鹏

2020年4月13日于武汉

武汉希望组医学检验实验室满分通过全国新型冠状病毒核酸检测室间质量评价

近日,国家卫生健康委临床检验中心公布全国新型冠状病毒核酸检测室间质量评价结果,武汉希望组医学检验实验室满分通过,并获得室间质评合格证书。

关于全国新型冠状病毒核酸检测室间质量评价

核酸检测是新型冠状病毒肺炎(Corona Virus Disease 2019,COVID-19)确诊的重要手段,为了解我国新型冠状病毒(2019 novel coronavirus, 2019-nCoV;国际病毒分类委员会将2019-nCoV命名为SARS-CoV-2)核酸检测的开展现状及质量状况,帮助临床实验室发现检测中存在的问题并进行改进,使得核酸检测在疾病防控工作中更好地得到应用,国家卫生健康委临床检验中心于2020年3月开展了新型冠状病毒核酸检测室间质量评价。本次“全国新型冠状病毒核酸检测室间质量评价”主要评价实验室对新型冠状病毒核酸检测的能力,重点考察实验室检测的分析性能,包括分析敏感性和分析特异性。

 

室间质量评价(EQA,external quality assessment),是多家实验室分析同一标本、并由外部独立机构收集和反馈实验室上报的结果、以此评价实验室操作的过程。通过实验室间的比对判定实验室的校准、检测能力以及监控其持续能力。室间质量评价是国际公认的临床实验室全面质量管理的重要组成部分,也是世界上多数国家临床实验室行政管理和实验室认可的基本要求。

武汉希望组医学检验实验室满分通过全国新型冠状病毒核酸检测室间质量评价,证明了武汉希望组新冠病毒核酸检测结果的可靠性、稳定性,有能力为一线抗疫提供高效精准的核酸检测筛查。同时,武汉希望组正在开发基于纳米孔测序技术的冠状病毒全基因组检测技术,与基于qPCR的技术形成有力互补,为疫情防控提供关键技术支持!

项目文章||九江学院张化浩博士研究团队发表中国特有物种黑尾近红鲌高质量基因组

2020年3月26日九江学院药学与生命科学学院、赣州市水产研究所和西南大学家蚕基因组生物学国家重点实验室等多家研究单位,在Molecular Ecology Resources期刊发表题为”High-quality genome assembly and transcriptome of Ancherythroculter nigrocauda,an endemic Chinese cyprinid species的研究论文。该研究利用三代测序技术结合Hi-C技术组装出中国特有鲤科鱼类黑尾近红鲌的染色体水平基因组,基因组大小为1.04 Gb,contig N50为3.12Mb。该高质量基因组为黑尾近红鲌种群保护及功能基因组学研究提供了宝贵资源。九江学院药学与生命科学学院张化浩博士、张小谷教授,西南大学代方银教授为共同通讯作者。未来组承担了该研究中的三代测序及分析工作。
黑尾近红鲌(Ancherythroculter nigrocauda)属于鲤科近红鲌属,是我国特有物种,仅分布于长江中下游,是重要的长江经济鱼类。近年来,由于过度捕捞、水坝建设和水污染,导致黑尾近红鲌自然种群急剧减少成为濒危物种。黑尾近红鲌迄今尚未有参考基因组,限制了对其生物学特性的深入分析以及优质种苗的选育。
图1  黑尾近红鲌
研究者利用流式细胞术及Kmer-based 方法估计黑尾近红鲌基因组大小在890~920Mb,杂合度0.7%。随后,利用PacBio Sequel对其进行测序,获得101.8Gb平均reads长度10.6Kb的过滤后数据,从头组装出1.04Gb的黑尾近红鲌基因组,contig N50为3.12Mb。结合Hi-C数据将1,297个contig序列挂载到24条染色体上(图2),包含了97.2%的全基因组核苷酸碱基,BUSCO数据库评估该基因组完整性为95.6%。与其他已公布基因组的鱼类相比,黑尾近红鲌基因组大小与草鱼、武昌鱼相近,并且均为24条染色体。
图2 黑尾近红鲌Hi-C挂载热图
注释结果显示,黑尾近红鲌基因组中含有56.1%转座子序列,其中DNA转座子类型占31.34%,RNA转座子或逆转录转座子占16.27%。共预测到34,414个蛋白编码基因,其中27,042个基因(78.5%)得到功能注释。
 
随后研究者利用12个脊椎动物基因组中的712个单拷贝直系同源基因构建系统发育树。发现黑尾近红鲌与武昌鱼亲缘关系最近,并于879万年前分化(图3)。
图3 利用12种脊椎动物的712个单拷贝基因构建的系统发育树
研究者进一步将黑尾近红鲌的基因组与普通鲤鱼、武昌鱼、草鱼、斑马鱼和日本青鳉的基因组进行了对比分析。结果发现,黑尾近红鲌基因组中有366个基因家族发生了扩张(包含499个基因),有72个正向选择基因。大部分扩张基因家族和正向选择基因在黑尾近红鲌脑部高表达(图4),表明这些基因可能在黑尾近红鲌的大脑发育中发挥重要作用。
图4 72个正向选择基因在黑尾近红鲌10个组织中的表达水平热图。
转录组数据分析发现,在黑尾近红鲌10个组织中,与环境信息处理、循环系统和生长发育等相关的10,732个基因的表达具有组织特异性。来自大脑、肝脏和肌肉的差异表达基因(DEGs)数量与其他组织的DEGs有很大差异。
总之,本研究利用三代测序技术结合Hi-C技术组装出中国特有鲤科鱼类黑尾近红鲌的染色体水平基因组,为黑尾近红鲌种群保护及功能基因组学研究提供了宝贵资源。