技术突破丨希望组“10X+ONT-Q20+”长读长单细胞测序实测通过!!!

2021年ONT在科研团体大会(Nanopore Community Meeting)上发布了”Q20+”试剂产品。这是利用包含最新“Q20+”化学试剂并支持“双链”(Duplex)测序的新试剂盒LSK112和最新芯片R10.4相结合的测序技术,可以实现>99%的原始reads(单链)准确度,或约Q30的双链(Duplex)准确度。

希望组(GrandOmics)作为中国最早开展ONT测序服务的公司之一,一直走在技术应用的前沿,率先将高通量单细胞分选平台10X和ONT最新技术进行组合创新,给火热的单细胞测序领域,提供了全新的技术解决方案。

测试背景

2020年8月于Nature Communication杂志发表的题为“High throughput, error corrected Nanopore single cell transcriptome sequencing”的研究论文,将单细胞与Nanopore全长转录组进行了技术整合,使得在单细胞水平上检测差异RNA剪接和RNA编辑成为可能。利用Illumina对10X Genomics文库进行短读长测序,为每个基因和基因组区域定义相关的Cell Barcode,随后为每个细胞、基因或基因组区域定义相关的UMIs组合。进而利用上述信息指导Cell Barcode和UMI分配到已比对至基因组上的Nanopore reads,通过对相同UMI的reads进行分组,校正和拆分Nanopore测序reads,用于开展下游的isform分析和RNA编辑。考虑到ONT-Q20+测序即将成为行业新的长读长测序技术标准,我们迫不及待的进行了新的尝试。

测试方式

10X单细胞平台获得的全长cDNA分成两份,一份进行常规二代测序,另外一份进ONT Q20+R10.4测序,利用二代测序数据的UMI指导进行 ONT测序的数据拆分。

测试样本

某人类PBMC样本,采用最新GPU进行Super高精准度Basecalling。尽管大大提高了计算消耗,但预期可以得到最佳的单碱基质量。

测试结果

一、下机数据统计

下机数据质控统计表

Reads长度分布图

单张测序芯片的产量为36.7Gb,pass产量为29Gb。尽管产量仍有提升空间,但通过芯片及算法的升级,basecalling的准确度有了大幅度的提升,reads平均分可达到15.98,最终获得了20 Mb的reads进行下游分析,和其他长读长平台所产生的reads数相比,有着明显的产量优势。该芯片样本为单链测序样本,相信在”Duplex”的模式下,样本的测序准确度会有更进一步的提升。

2. 与参考基因组比对identity

左图Q20+R10.4的比对identity分布图,右图为LSK110 R9芯片的比对identity分布图

从图中可以发现,同个样本不同的测序试剂和芯片,对于最终比对identity的准确性有着显著的差异。LSK110 R9 base-calling fast模式的比对identity中位值在87.1%,Q20+R10.4的比对identity中位值达到了97.9%。整体数据的准确度有了明显的提升。

3.数据分解率

随着数据准确性的不断提高,利用二代UMI数据指导拆分三代全长转录组数据的比例也会有相应的提升空间,内部数据表明二代UMI数据指导拆分三代全长转录组数据的拆分率可达70%,远远高于Nature Communication文章里50%的拆分率。相信在“Duplex”模式下的数据表现会有更加亮眼。敬请关注希望组后续的相关报道!

当10x单细胞样本遇上Oxford Nanopore Q20试剂及R10.4芯片,有效提升UMI的数据拆分率,拥有更多有效数据进行下游分析。尽管“Q20+”目前处于试测阶段,但相信未来在基因组、转录组上的应用场景会不断增加。希望组早在2020年年底已经推出了利用纳米孔平台进行单细胞全长转录组的产品SCAN-seq。现在有了Q20试剂的加持,拓宽了单细胞全长转录组的应用场景和需求,可以为广大科研工作者提供更好、更优质、更前沿的技术!

项目文章丨PNAS封面!李家堂团队等揭示“飞蛙”滑翔的遗传机制

近日,中国科学院成都生物研究所李家堂研究团队等以云南西双版纳地区的“飞蛙”——黑蹼树蛙为研究对象,通过多维度研究手段,阐明了其攀爬和滑翔行为相关表型的遗传机制。相关研究在《美国科学院院刊》以封面论文形式发表。希望组在本研究中提供了三代测序组装、注释以及Hi-C测序、挂载服务。

动物复杂性状是动物长期适应演化的结果,是动物多样性形成的重要基础。自然界物种采取各种各样的进化策略以适应不同的栖息地,如高原、海洋、荒漠等。部分类群通过演化出了特殊的表型以适应树栖生活。树栖生活拓展了这些物种对垂直空间资源的利用,有助于它们躲避天敌,获取丰富的食物资源等。但森林环境复杂的立体结构也对动物的运动能力提出了严苛的要求。

在白垩纪末期大规模物种灭绝事件后,无尾目多个科的物种独立演化出了攀爬和滑翔的相关表型,并成功拓殖树栖生态位,黑蹼树蛙就是其中的代表性物种。黑蹼树蛙隶属于树蛙科,常年生活在热带雨林树冠层,是典型的树栖蛙类。据报道,其最高栖息高度达57米,为目前树栖蛙类停留高度的最高记录。黑蹼树蛙具有强大的滑翔能力,因此又被称为“飞蛙”,为揭开两栖动物树栖适应之谜提供了良好的动物模型。

 黑蹼树蛙,饶涛绘

近日,中国科学院成都生物研究所李家堂研究团队等以云南西双版纳地区的“飞蛙”——黑蹼树蛙为研究对象,通过多维度研究手段,阐明了与攀爬和滑翔行为相关表型的遗传机制。

研究团队选择了蹼发达的黑蹼树蛙(满蹼)和宝兴树蛙(微蹼)开展行为学实验。研究人员分别设置了1,1.5和2米的高台,让两种树蛙分别落下并记录运动轨迹。

结果发现
黑蹼树蛙在下降过程中会尽力撑开四肢,依靠满蹼维持空气动力学平衡,使其身体与水平面夹角始终小于宝兴树蛙。而宝兴树蛙则更像是在“跳楼”。这一结果提示树蛙的蹼在滑翔过程中起到重要作用,是支撑滑翔行为的重要性状。

两种树蛙形态学比较与行为学实验

两种树蛙蝌蚪发育时期的肢体形态学比较提示两者之间存在不同的发育模式。以两种树蛙高质量基因组为基础,结合蝌蚪四肢发育过程中的转录组数据,通过时序基因共表达网络分析,发现黑蹼树蛙蝌蚪肢体在发育阶段特异共表达一系列与Wnt信号通路和血管重构相关的基因。这种发育时期特异表达模式可能通过参与指和指间区域生长速率的调控对蹼足的形成起到关键作用。

两种树蛙蝌蚪肢体发育过程形态学比较与时序基因共表达网络分析

树蛙中调控角蛋白和细胞骨架形成的PPL基因受到正选择,且存在树蛙属内保守的氨基酸替换,这可能有助于树蛙攀爬相关性状——吸盘的形成。壁虎的刚毛主要由β角蛋白扩张形成,而树蛙指/趾尖吸盘的主要结构蛋白为α角蛋白,而α角蛋白同样是哺乳动物和人类毛发纤维最主要的成分之一。

“这些祖先角蛋白可能在早期四足动物需要皮肤强化的区域中表达,而随后分化为支持两栖动物和哺乳动物不同的适应性结构”。

本研究通过前期大量的野外观察,整合形态学、行为学和组学等学科研究手段,系统解析了“飞蛙”滑翔的遗传机制,为人类认识动物有趣行为提供新的视角,对动物特殊功能的仿生研究及人类并指症等相关疾病的防治有重要基础科学价值。

该研究成果以“Genomic adaptations for arboreal locomotion in Asian flying treefrogs”为题在《美国科学院院刊》以封面论文形式发表(点击左下角阅读原文)。本研究得到中国科学院B类先导科技专项、国家自然科学基金等项目的资助。

武汉希望组被认定为湖北省专精特新“小巨人”企业

12月24日,湖北省经济和信息化厅公布了“湖北省第三批专精特新‘小巨人’企业名单”,经各市州经信部门初核和推荐、专家评审及社会公示等程序,全省共有1025家企业被授予“湖北省专精特新‘小巨人’企业”称号,武汉希望组生物科技有限公司(“希望组”)成功入选。
“专精特新”主要集中在新一代信息技术、高端装备制造、新能源、新材料、生物医药等中高端产业,科技含量高、设备工艺先进、管理体系完善,市场竞争力强,专精特新在中小企业创新转型中发挥较好的示范引领作用。
1、“专”是指采用专项技术或工艺通过专业化生产制造的专用性强、专业特点明显、市场专业性强的产品。其主要特征是产品用途的专门性、生产工艺的专业性、技术的专有性和产品在细分市场中具有专业化发展优势。
2、“精”是指采用先进适用技术或工艺,按照精益求精的理念,建立精细高效的管理制度和流程,通过精细化管理,精心设计生产的精良产品。其主要特征是产品的精致性、工艺技术的精深性和企业的精细化管理。
3、“特”是指采用独特的工艺、技术、配方或特殊原料研制生产的,具有地域特点或具有特殊功能的产品。其主要特征是产品或服务的特色化。
4、“新”是指依靠自主创新、转化科技成果、联合创新或引进消化吸收再创新方式研制生产的,具有自主知识产权的高新技术产品。其主要特征是产品(技术)的创新性、先进性,具有较高的技术含量,较高的附加值和显著的经济、社会效益。

GrandOmics + Sentieon丨希望组与Sentieon联手打造长读长测序数据分析新工具

近日,北京希望组与Sentieon联合宣布,双方决定在基因组数据分析的多个领域进行战略合作,持续推动包括二代和三代测序在临床诊断的产品落地。

双方合作的重点包括了以下四点:

1.联合推出基于PacBio HiFi数据的基因组重测序分析流程,变异检测范围包括了SNP,Indel和SV(结构变异);2.面向ONT最新推出的Q20+最新试剂数据,双方将进一步联合开发全面覆盖SNV/Indel/SV的变异检测产品;

3.验证并部署基于Sentieon已经完成的MGI数据全基因组(WGS)分析流程;

4.将双方的合作纳入“希望诊断计划”,为该计划开发并搭建全方位的长、短读长结合的大数据变异分析平台。

GrandOmics长读长数据SV检测软件——GrandSV

高质量的结构变异检测,是基因组医学的基石,无论是针对罕见病、肿瘤,还是辅助生殖,各种基因组医学的应用,均急切的需要新型的工具解决复杂的基因组结构变异检测问题。

长读长测序对于大片段的结构变异检测具有天然的优势。综合长读长数据分析算法中的序列拼接和序列比对算法,希望组开发了针对于长读长测序数据(PacBio HiFi和ONT)的SV检测软件——GrandSV。和以往长读长数据SV检测软件相比,兼顾了两种特征鲜明、截然不同的长读长数据(PacBio HiFi/ONT),具有更高的准确度和灵敏度。

利用准确度在99%左右的PacBio HiFi模拟数据来评估GrandSV与同类型软件cuteSV v1.0.9,Pbsv v2.4.0,Sniffles v1.0.12在人类基因组上鉴定结构变异(SV)以及变异分型(Genotyping)的准确性和灵敏度。图1的结果显示,GrandSV在5-30X的不同深度上效果都是最好的之一。此外,模拟Super Accuracy basecalling模式下的ONT数据分析结果也同样显示出了GrandSV的不俗表现。

图1. Benchmark with simulated PacBio HiFi and ONT (SUP model) data

除模拟数据外,基于HG002的PacBio HiFi和ONT真实数据,并以Genome in a Bottle Consortium (GIAB) 团队发表的34,830个高置信区间当做真实的背景数据集来评估GrandSV表现。结果依然显示GrandSV的整体效果在5-30X的不同深度上都是最优的之一。

图2. Benchmark with HG002 PacBio HiFi and ONT data

相较于其他长读长SV检测软件,GrandSV有着更高的灵敏性。图3是HG002中一个长的片段插入,由于测序reads太短,单条read无法跨过,导致其他的软件在此处只能检出断点,而GrandSV通过局部组装可以完整的组装出跨过这个SV的一致性序列。图4是HG002中两个杂合的片段插入,其他软件只能检测出一个平均长度约94bp的片段插入,而GrandSV能够准确检测出两个不同的杂合的片段插入。

图3. Only GrandSV called correctly for a 9562 bp INS

图4. Only GrandSV called correctly for a 60 bp INS and a 122 bp INS

Sentieon三代PacBio HiFi数据SNP/Indel检测软件——DNAscope LongReads

Sentieon在二代测序中SNP/Indel变异检测流程已非常成熟,并以其检测准确性高和检测速度快而广受业内人士认可。近日,Sentieon推出了DNAscope LongReads分析流程,深度改进DNAscope流程,加入Sentieon分型(Phasing)模块,高速准确分析PacBio HiFi数据进行SNP/Indel检测。

DNAscope LongReads运算效率高,速度相比开源软件有很大的提升。其中比对模块Sentieon Minimap2与原版相比提速2倍,而变异检测模块与DeepVariant相比提速6倍,有助于用户提升交付速度,降低计算成本。

准确度方面,DNAscope LongReads流程获得了FDA挑战赛PacBio数据的两个分项冠军,SNP的F1 score达到了0.9993,Indel为0.9943。在低深度下对比10x PB HiFi,16x PB HiFi,30x Illumina的全基因组测试结果,可以发现全基因组范围内16x的HiFi数据的准确率就已经超越了30x Illumina的数据,在低复杂度的基因组区域内即使10x的HiFi数据也可以超越Illumina的准确度。

图5. SNP and Indel accuracy on HG003 WGS Data, PB HiFi vs ILMN

长读长数据可以覆盖Illumina序列所无法覆盖的区域,例如395个位于常染色体上复杂区域的临床相关基因(CMRG)。这些基因具有重要的临床价值,然而由于所处基因组区域较为特殊,短读长序列难以比对。以SMN1基因为例,该基因是脊髓性肌萎缩症的致病基因,最常见的突变是外显子7和8的缺失。从下图可以看出,只有PB HiFi数据可以覆盖相关区域,得出变异检测结果。

图6. PB HiFi covers SMN1 gene region when ILMN reads fail

通过结合双方在长读长变异检测流程中的特有优势,将点突变及大片段的结构变异整合分析,推出的完整HiFi全基因组重测序分析流程,将极大地加快PacBio HiFi测序的临床应用。基于本次成功经验,在未来,双方团队还会在Oxford Nanopore的数据处理上进行合作,为业界带来更多优质的Long Reads重测序的分析流程。同时双方也会持续在其他领域包括华大测序平台应用,以及“希望诊断计划”项目中保持合作,共同加速全基因组临床产品的市场教育和推广工作。

希望组荣膺“2021中国医疗创新力企业TOP10”

10月11日-13日,“天府健谈·CHS 2021第六届中国大健康产业升级峰会”召开,本次峰会由中国卫生信息与健康医疗大数据学会全科医学与健康管理工作委员会、亿欧EqualOcean主办,四川省卫生健康委、中国卫生信息与健康医疗大数据学会指导。

会上重磅发布了2021中国数字医疗企业百强榜系列榜单,经过历时数月的评选,拥有丰厚三代测序应用与发展的希望组凭借三代测序在临床医疗诊断产品上的不断创新,从众多企业中脱颖而出,成功入选“2021中国医疗创新力企业TOP10”。

武汉希望组被认定为“湖北省企业技术中心”

近日,湖北省发展和改革委员会公布了“2021年(第27批)湖北省企业技术中心认定名单”,经资格审查、初评、专家评审、现场考察、部门审查、信用审查、公示认定等环节,全省共有64家企业技术中心被认定为湖北省企业技术中心,武汉希望组生物科技有限公司(“希望组”)技术中心成功入选

“湖北省企业技术中心”是省内规格最高的技术创新平台之一,由湖北省发展和改革委员会牵头,联合湖北省科学技术厅、湖北省财政厅、武汉海关、国家税务总局湖北省税务局等国家机关,从企业的行业竞争力、技术创新战略和规划、创新成果、财务指标、管理体系以及通关、涉税、诚信等方面进行综合评估,对创新能力强、创新机制好、引领示范作用大、符合条件的企业技术中心给予认定,并给予政策支持,鼓励引导行业骨干企业带动产业技术进步和创新能力提高。

希望组专注于在三代测序平台上进行技术开发与应用拓展,目前,已经形成了“科技服务”、“医学诊断”、“生物信息”、“先进制造”四大业务模块;在北京、武汉建设了合计超过5,000平米的科研服务平台、医学检验实验室和大数据分析数据中心,引进了国际先进的ONT PromethION 48、PacBio Sequel II、MGISEQ2000/T7、Bionano Saphyr光学图谱等技术平台。同时,希望组技术中心建立了完善的管理规章制度,为强化研发管理、激励技术创新,充分发挥公司技术中心在科技成果研发与转化方面作用提供机制和制度保障。

此次希望组被认定为“湖北省企业技术中心”,体现了政府主管部门对公司技术实力的高度认可,彰显了公司在技术研发和创新方面的实力。省级企业技术中心的建立是公司技术创新的又一里程碑,将成为公司今后高质量发展的助推器,推动公司技术研发创新水平的持续进步。

希望组荣获“安永复旦最具潜力种子企业”

2021年9月23日, “安永复旦最具潜力企业2021”评选结果于上海揭晓。经过专家团队专业、严格的评选,希望组凭借三代测序大数据的技术应用,从众多参选企业中脱颖而出,当选为本年安永复旦最具潜力企业之一(种子企业)。

希望组CEO汪德鹏(左二)现场领奖

“安永复旦最具潜力企业“评选活动由安永联合复旦大学管理学院举办,旨在于在企业的发展初期发掘出能在未来成为国家支柱产业的明日之星。该评选活动历经十一载,凭借其公开而权威的评选准则,已成为社会影响广泛、经济意义深远的活动。本届评选旨在发掘逆流而上、颠覆改革传统技术领域与进一步发掘市场空间的未来行业领袖,同时也希望能借此项活动,让资本市场更进一步认识中国优秀的新兴企业,助力其实现高速成长。

 颁奖典礼祝酒合影

本次获奖是对希望组在三代测序应用开发领域工作的高度肯定,同时也为公司未来发展注入了强心剂。希望组前瞻性地看到了三代测序的产业级机会,未来将继续以科技服务为切入点,以生物信息为特色,结合医学研究服务与医学诊断,同时布局先进医疗制造领域,将自身发展深入基因测序的全产业链,从而推动基因测序产业的持续发展。

希望组荣获基因检测行业“年度最具投资价值企业”奖项

近日,由南方医学网、基因谷、早筛网共同举办的“2021基因检测行业发展高峰论坛”在广州成功举办。希望组作为中国长读长测序技术应用的开拓者,从参评企业中脱颖而出,荣获“2021基因检测行业年度最具投资价值企业”奖项!

会上,希望组CEO汪德鹏发表了题为“‘长枪短炮’进攻遗传病难题”的主题演讲,介绍了希望组在三代测序遗传病诊断领域的成果;同时提出了结合三代测序(长枪)和二代测序(短炮)技术,实现遗传病精准检测的方案。希望组致力于三代测序技术的应用,在三代测序领域深耕多年,构建了ONT PromethION 48、PacBio Sequel II三代测序技术平台;基于三代测序,建立了人类基因组结构变异数据库(dbSV),开发了结构变异分析软件(GrandSV)。此次推出的“‘长枪短炮’方案,利用二代测序低成本、高通量、高准确度的特点,用于基因编码区小变异(SNP/Indel)的检测;结合三代测序长读长优势,通过长读长测序全基因组测序,利用希望组分析软件和数据库实现结构变异的精准检测,有效提升遗传病的检出率,可以发现新的疾病相关结构变异断点,为遗传病诊断、辅助生殖和基因治疗提供了新的思路。

希望组CEO汪德鹏发表主题演讲

在随后的圆桌分享环节中,就“全面建设健康中国与基因检测未来展望”的主题,公司CEO汪德鹏与专家及企业代表共同探讨中国基因检测行业的现状,未来发展,以及三代测序的应用方向和前景。

希望组CEO汪德鹏参与圆桌会议

希望组将继续践行“让生命充满希望”的使命,坚守“ 创新、创造价值,并创造利润”经营原则,不断探索长读长测序技术在科学研究及医学诊断领域的应用,推动新技术的临床转化和落地,为健康中国建设做出积极贡献,实现全球三代测序技术与应用领域领军企业的战略目标。

创新合作!希望组集团引进华大智造超高通量测序仪DNBSEQ-T7,推进遗传病精准诊断技术创新与发展

2021年9月6日,北京希望组生物科技有限公司(以下简称“希望组”)正式引进深圳华大智造科技股份有限公司(以下简称“华大智造”)旗下超高通量测序仪DNBSEQ-T7,共同推进遗传病精准诊断技术的创新与市场化落地。

 

“长枪短炮”模式创新

瞄准遗传病精准诊断

高通量测序技术近年来在遗传病检测领域得到了广泛应用,以靶向测序及全外显子组测序为代表的技术已成为遗传病诊断的重要工具。全基因组测序(WGS)理论上可以同时检测单核苷酸变异、结构变异(含拷贝数变异)及线粒体变异等,有望进一步提升临床检测的效能。

作为国内长读长、高通量测序服务的探路者,希望组在遗传病检测领域积累了丰富的项目经验。基于长读长测序技术(Long Reads Sequencing, LRS),希望组解决了大片段结构变异检测难题,让面肩肱型肌营养不良症、杜氏肌营养不良症等疑难基因组病的精准诊断不再遥不可及。值得关注的是,希望组在业界首开先河,基于现有方案结合DNBSEQ-T7超高通量、高准确性的技术优势,提出了“短读长+长读长”遗传病精准诊断新模式,进一步提高致病变异的检出率,让更多的遗传病患者得到确诊。随着DNBSEQ-T7等强势机型的陆续入驻,希望组将在遗传病精准诊断领域开创更多可能性。

 

提高检测通量、降低检测成本

推进遗传病精准诊断市场化落地

“DNBSEQ-T7的顺利入驻是继2019年希望组引进MGISEQ-2000之后对高通量测序服务能力的又一次重大升级和重要战略部署,”希望组CEO汪德鹏表示,“希望组始终致力于将基因测序技术创新性应用于科技服务、精准医学领域。随着DNBSEQ-T7超高通量测序平台的启用,希望组将成为同时拥有长、短读长超高通量测序平台的服务商,为用户提供更快、更丰富、更优质的服务!”

华大智造首席运营官蒋慧表示,“高质量测序的核心工具平台是生命科学研究、精准医疗以及相关产业创新发展的基础。我们希望通过DNBSEQ-T7测序平台的技术优势,助力希望组的核心业务实现突破性跃迁,从而共同推动生命科学及精准医学领域的创新发展,赋能更多下游用户。”