武汉希望组医学检验实验室有限公司 危险废弃物产出明细公示表(2022年度)

武汉希望组医学检验实验室有限公司
危险废弃物产出明细公示表(2022年度)
组织机构代码91420100MA4KXQ2J1P
法定代表人汪德鹏
生产地址武汉市东湖新技术开发区花城大道8号武汉软件新城C11栋17楼
生产经营内容(共1个一级诊疗科目)医学检验科(临床免疫、血清学专业,临床细胞分子遗传学专业)
序号12
危险废弃物类别HW01医疗废物HW49其他废物
危废名称感染性医疗废物其他废物
危废代码841-001-01900-047-49900-041-49900-039-49
处置方式Y10医疗废物焚烧C1水泥窑共处置
主要成分废弃离心管、废吸头、废试剂瓶和废采血管,一次性医用口罩、手套、帽子等实验用品实验室废液、废试剂瓶、废弃滤料、废活性炭等
产废工序一次性医用口罩、手套、帽子等实验用品为检验人员使用后医疗废物,废弃离心管、废吸头、废试剂瓶和废采血管为接触过样本或检验试剂的废弃医疗废物。1.高通量测序技术又称“下一代”测序技术,以能一次并行对几十万到几百万条 DNA 分子进行序列测定和一般读长较短等为标志。主要实验内容包括样品提取、 检测、文库构建及高通量测序。2.荧光定量 PCR 检测的所有样本为外部采血送检或拭子样本,主要实验内容包括样品提取和检测。实验过程中使用试剂盒试剂产生的其他废弃物。
危险特性潜在感染性潜在毒性
安全措施我机构产生的医疗废物统一使用专用医疗垃圾袋密封,经次氯酸钠喷洒、高温高压等消毒措施处理后集中存放于医疗废物暂存间医疗垃圾桶。医废暂存间由专人进行管理,暂存环境使用次氯酸钠和紫外灯照射消毒,医疗废物委托给武汉汉氏环保工程有限公司处置。其他废弃物经专人收集、保存、管理,建立管理台帐,委托给华新环境工程(武穴)有限公司处置。
贮存区域医疗废物暂存间废物暂存间
处置去向武汉汉氏环保工程有限公司华新环境工程(武穴)有限公司
暂存间管理员陈青莲15088774572赵云龙13628692752
紧急联系人陶庆15572523735陶庆15572523735
相关联系人杨婷婷15012731512杨婷婷15012731512
产生量(2022年)(单位:吨)25.8890.247
转运量(2022年)(单位:吨)25.8890.247
库存量(2022年)(单位:吨)00

源代码公开 | 希望组正式公开NextDenovo软件源代码

2013年3月11日,希望组(未来组)开始提供三代测序服务,成为中国首家三代测序服务公司。在不断探索与进化的过程中,公司首席生信技术官胡江团队自主研发了三代测序基因组组装领域著名的组装软件NextDenovo,该软件在极大减少计算资源和运行时间的前提下,仍然能够组装出高质量基因组,具有高纠错、高效率、高准确度的优势。今天,在我们正式提供三代测序服务第十周年,我们向全球公开该软件的源代码,并同时预印发布NextDenovo软件科学论文《An efficient error correction and accurate assembly tool for noisy long reads 》,为整个行业的健康、快速、高质量发展做出自己的贡献。

目前,该软件在论文发表之前已经累计下载11000余次,助力发表文章约500篇,受到国内外众多专家学者的一致认可和好评。


为了让大家更多的了解NextDenovo的一些背景,我们专访了希望组首席生信技术官胡江,内容如下:

1.请问当初你研发这个软件的原因是什么?
大约在2018年初,全世界组装软件做PacBio或Illumina数据的比较多,适用于Nanopore测序(ONT)数据的组装软件很少,因当时ONT测序的错误率非常高,要真正使用这些数据进行组装,要么极其消耗计算资源,要么组装效果非常差,导致我们大量ONT测序的de novo组装项目积压、交付困难,为了解决这个全球性的技术难题,我们专门立项开发NextDenovo。

2.你觉得NextDenovo的优势在哪里?
要说优势的话,可能在某些物种的组装完整度上,比如说像我们做的玉米,我们能组装到60M,现在行业里绝大部分组装软件可能只能装到20M,这个对比还是很明显的。另外一个优势就是我们可以从算法上从底层上去调整、修改,可以大范围的去解决在组装过程中每个物种所特有的个性化问题,这个大部分其他商业公司做不了的,因为大部分其他商业公司都只是使用别人开发的软件,底层的东西没法改变,但是我们可以在遇到困难的时候随时修改。

3.请问你为什么选择公开源代码?软件还会不会进行持续更新,NextDenovo和NextDenovo2有何区别?
公开一方面是为了进一步为科研领域做一点分内贡献,另一方面也是很多用户的需求。NextDenovo是针对PacBio CLR或者ONT这种高错误率的数据开发的,组装出来的结果是一个嵌合体,同时也无法直接组装出近T2T水平。NextDenovo2是针对ONT新数据即长又准的特点开发的,主要是用于组装多套基因组(分型),另外可以用于直接组装T2T水平的基因组。

4.如今科技发展迅速,你觉得未来有没有其他软件超越NextDenovo?对此你怎么看?
对于组装软件来说,每一个软件都有自己的特点,不存在哪个软件绝对好,大部分软件在某些数据或者某些物种上表现优于其他软件,但是在另外一些数据或者物种上表现就会差一些。同时,在内存消耗或者运行时间,组装结果准确度上来说,每个软件都有各自的优势,用户可以基于自己的需求选择合适的软件。作为一个组装软件开发者来说,我们的工作就是基于技术的更新,不断更新自己的软件,同时积极解决用户的问题,帮助用户快速了解、运行软件。我们可能会一直存在的一个优势就是,我们有大量的项目训练,会使NextDenovo软件继续一直的不停升级、迭代,从而大概率持续保持竞争力。

5.给我们一些想学习软件开发的人的一些建议吧?
首先就是去把我们常用的软件的文献看懂,还有一些基础的算法,比如比对算法,都有很多详细的计算一定要看懂。因为生信的算法相对来说还是比较简单的,因为都是学生物的人写的,所以不像谷歌、百度这些公司的写的那么复杂。还有就是要不断地要花时间去研究,沉下心来,总是会有收获的。

6.最后,你能介绍一下NextDenovo软件名字的来由吗?
我们开发这个软件的时候,借鉴了华大基因当年开发二代测序软件取名——SOAPdenovo,我们想,我们是中国第二家真正开发组装软件的公司,我们又是在三代测序新技术上开发的,我们干脆就叫NextDenovo吧,就是Next-Generation Denovo的意思,我们的初心是做下一代的最前沿的组装算法和工具。

西安交通大学 叶凯教授

在基因组领域,常用和好用的软件往往是欧美顶尖实验室开发的,这导致我国在样本资源丰富、数据质量并不落后的情况下,总是落后半拍。NextDenovo的开源发布,为我国基因组研究提供了关键技术支撑,为世界基因组研究贡献中国智慧。希望组作为一家企业,发布自主研发的计算方案,却不限制商用,为领域树立了一个标杆,开启了我国基因组领域企业、科研单位开放合作、交叉创新的新篇章。

中山医院眼科 肖传乐教授

NextDenovo是一套非常优秀的序列校正和组装软件。该软件的校正算法详细设计了针对重复区域的校正方法,相比Canu和NECAT相比,该软件在重复区域的校正方面表现出色。因此,该软件特别适合用于校正含有重复区域的超长读长序列,校正后序列的精度可以高达97%-99%,高精度的重复区域校正使得后续的端到端组装变得容易和简单。高精度超长读长校正数据与HIFI数据能够充分发挥其超长和高精度的优势,从而显著提高了端到端基因组组装的成功率,这也是希望组公司成功组装端到端基因组案例最多的原因之一。此外,各种基因组组装软件性能在不同基因组中表现都不一样,其主要原因是组装软件开发者没有足够的数据对软件进行反复提升,而NextDenovo源于希望组公司,可以很好克服这个问题。NextDenovo经历了各种复杂基因组组装难题的提升,并成功应用于许多超复杂和巨大的基因组组装。这些宝贵的经验将被写入NextDenovo软件算法中,值得我们科研人员学习和借鉴。”

昆明动物所 吴东东研究员

三代基因组测序技术飞速发展,相关研究领域也迎来新的一波助力。NextDenovo软件在三代测序数据方面表现出高纠错、高效率、高准确度的优势,尤其针对价格相对便宜的Nanopore 三代测序数据。软件自从公开后,在行业内引起广泛关注和使用,不乏肺鱼、南极磷虾等超大基因组的组装。 相信NextDenovo系列软件必将助推三代测序技术在人类队列泛基因组、精准医学、肿瘤基因组、遗传疾病诊断、农业基因组辅助育种、保护基因组学等等方方面面的应用。

希望组 CEO汪德鹏

10年前,我们学习Michael Schatz、Evan Eichler、Michael Snyder、Au Kin Fai、Jason Chin等行业领导者文章和报告,在全世界学术开放、合作的环境中成长;今天,10年之后,也应该我们为全世界学术界贡献我们自己的研发成果,为全球学术开放和合作添砖加瓦。

本次NextDenovo公开源代码后,我们将继续研发它的升级版本NextDenovo2,NextDenovo2将主要瞄准三代测序T2T基因组组装。NextDenovo开源之后,将不再限制基因组的大小,也不再限制基于NextDenovo的商业使用,但是,如果需要全方位的技术支持,希望组将继续为全球客户提供技术支持服务。

使用NextDenovo软件组装的基因组已发表文献精选:
01南极磷虾基因组
文章:The enormous repetitive Antarctic krill genome reveals environmental adaptations and population insights.
发表期刊:Cell

02非洲肺鱼基因组
文章:African lungfish genome sheds light on the vertebrate water-to-land transition.
发表期刊:Cell

03苏铁基因组
文章:The Cycas genome and the early evolution of seed plants.
发表期刊:Nature Plants

04燕麦基因组
文章:Reference genome assemblies reveal the origin and evolution of allohexaploid oat.
发表期刊:Nature Genetics

05中华绒螯蟹基因组
文章:“Omics” data unveil early molecular response underlying limb regeneration in the Chinese mitten crab, Eriocheir sinensis.
发表期刊:Science Advances

06樱花基因组
文章:Genome assembly, resequencing and genome-wide association analyses provide novel insights into the origin, evolution and flower colour variations of flowering cherry.
发表期刊:The Plant Journal

07红花槭基因组
文章:The chromosome-scale genome provides insights into pigmentation in Acer rubrum.
发表期刊:Plant Physiology and Biochemistry

08水稻基因组
文章:The telomere-to-telomere gap-free genome of four rice parents reveals SV and PAV patterns in hybrid rice breeding.
发表期刊:Plant Biotechnology Journal

09白菜基因组
文章:A near-complete genome assembly of Brassica rapa provides new insights into the evolution of centromeres.
发表期刊:Plant Biotechnology Journal

10西瓜基因组
文章:A telomere-to-telomere gap-free reference genome of watermelon and its mutation library provide important resources for gene discovery and breeding.
发表期刊:Molecular Plant

短序长序 包容并“序” | 序祯达生物携手希望组生物共建超高通量综合测序服务实验室

2023年2月13日,上海序祯达生物科技有限公司(以下简称“序祯达生物”)与北京希望组生物科技有限公司(以下简称“希望组生物”)签订了战略合作协议,双方将集合各自在短读长和长读长测序方面的优势进行全方位的资源整合和互补,并在中国(上海)自由贸易试验区保税区域(即外高桥保税区)共建超高通量综合测序服务实验室,协力开发高通量多组学检测分析技术在疾病机理研究、物种发现与鉴定、免疫与疫苗研制等领域的转化应用,运用新技术为科研服务、药物研发和临床科研领域的应用场景提供解决方案。新的综合测序服务实验室将为上海及周边地区客户带来极致测序服务体验。


联合实验室将基于序祯达生物和希望组生物现有的短读长与长读长测序服务平台,陆续引入更超高通量的Illumina NovaSeq X Plus测序仪与PacBio REVIO HiFi测序仪,全面升级研发技术平台水准,建立全新的多组学产业能力基线,打造首屈一指的能辐射上海及周边地区的超级高通量测序平台,为区域生物医药新基建架起新支柱。

序祯达生物创始人兼首席执行官孙乐乐表示:“序祯达生物自成立以来深耕于高通量测序技术的运用与发展,此次携手希望组生物共建短读长和长读长测序平台,进一步加快了公司在全读长测序技术方面的探索。希望组生物是国内领先的长读长测序技术服务商,相信通过我们双方的紧密合作,加速长读长测序与短读长测序结合的产品与解决方案的开发,把多元化的科学技术带到更广泛的应用场景中去。”

希望组生物创始人兼CEO汪德鹏表示:“希望组生物专注长读长测序已经有10年时间,2013年就开始在国内首家提供PacBio测序服务,也为整个长读长测序领域开发了很多配套的算法、软件、数据库和生物技术,在动植物和人类基因组T2T组装、群体泛基因组、全长转录组、全长单细胞转录组、长读长宏基因组、长读长三维基因组、长读长表观组等领域奠定了坚实的基础。而序祯达生物立足上海,面向全球,与国内国际大量高端客户建立了深度的合作关系,其构建的短读长领域的专业技术能力、大规模交付平台、严酷的质量控制体系、以及将客户利益永远放于首位的价值观,都给我个人留下了非常深刻的印象,也高度认可。此次与序祯达建立深度合作,在双方优势互补的基础上,可以为客户提供几乎完整的全组学研究解决方案。”

长读长测序与短读长测序的互补结合,可灵活满足不同样本类型(血液、组织、游离DNA、FFPE等)和研究课题(队列研究、生物标志物检测、宏基因组研究等)对测序的需求,经济高效地检测更多的样本,识别各种类型的变异,构建更完整、准确的泛基因组队列,解锁疾病机制研究的新大陆,进而加速推动生命科学、医学以及药物研发的创新和发展。

序祯达生物与希望组生物共同期待本次合作能发掘更多产业创新的机遇,打造新基建促进生物医药产业发展的先行示范。

正式预售丨希望组引进多台PacBio大型测序平台Revio,大规模HiFi测序服务正式开启预售

2022年10月25日,PacBio宣布推出新一代Revio高通量HiFi测序平台,全新设计的SMRT测序芯片和高性能计算模块使Revio平台能够大幅提高通量并显著降低测序成本,同时利用HiFi测序技术的“既长又准”的优势,可以轻松实现大规模群体基因组项目的全类型变异检测。

Revio测序平台一经发布,希望组(GrandOmics)立即确定引进多台Revio测序系统,并将配套Revio测序系统进行生物技术和生信算法的工具研发,构建基于高通量Revio测序的完整生态系统,从而使客户能更容易得到全面的服务升级,让HiFi测序应用于科学研究和临床诊断没有障碍。

2022年11月18日,在希望组10年的三代测序技术开发和应用服务的经验积累基础上,正式面向全球提供基于Revio平台的HiFi测序预售服务。

首先,让我们来再次介绍Revio系统的基本情况:

Revio测序系统通量提升15倍,成本大幅下降

根据PacBio官方信息:Revio采用了全新的SMRT Cell芯片,该芯片上有2,500万个零模波导孔(ZMW),是现有芯片(800万个ZMW)的3倍。Revio能同时并行4张SMRT Cell,可同时提供多达1亿个ZMW进行单分子实时测序。结合计算模块的升级换代,Revio将提供更短的运行时间,并将单台设备HiFi测序通量提升15倍(图1)。

图1 Revio测序系统HiFi数据通量提升15倍(数据来自PacBio)

Revio采用最先进的NVIDIA GPU加速系统,与Sequel IIe相比,Revio的计算能力提高了20倍。GPU为碱基识别和HiFi读序生成提供了更加快速的响应时间,与Revio系统的测序通量保持同步。Revio还将与Google Health开发深度学习方法集成到测序仪中,以此提高HiFi的产量和测序准确性(图2)。

图2 Revio测序系统HiFi数据准确度提升(数据来自PacBio)

Revio能够提供每年以30X覆盖度多达1300个人类全基因组进行测序的能力,将基于HiFi的人类全基因组测序推进至1,000美元级别时代。凭借通量的提升和成本的下降,Revio将使HiFi测序能够支撑人类遗传学、癌症研究、农业基因组学等领域的大规模研究。

希望组基于PacBio Revio测序平台,结合自身技术储备正式提供以下服务内容:

1. 全基因组测序(HiFi-WGS)
基于PacBio Revio测序技术,可直接进行甲基化检测,并配合希望组自主研发的基因组结构变异自动化分析工具GrandSV+GrandSTR,可以很好的检测复杂的结构变异,全面解析甲基化+结构变异+单体型。Revio可提供每年多达1300个30X覆盖度的人类基因组测序能力。针对人类、动植物群体三代测序全基因组研究,即将成为全球新的热点!

2. T2T基因组组装(HiFi-T2T)
利用PacBio Revio测序,常规基因组组装已经可以达到非常高的质量,结合希望组开发的纳米孔BAC-long(150Kb)测序和Bionano光学图谱,再利用希望组开发的NextDenovo2组装软件及NextPolish2矫正软件,我们可以轻松实现大规模群体基因组T2T组装任务。

3. 泛基因组测序(Pangenome)
泛基因组运用高通量测序及生物信息分析手段,通过具有内在关联的不同亚种个体测序分析,并分别进行组装,不仅可以获得多个基因组信息,完善该物种的基因集,还可以获得个体特有的DNA序列和功能基因信息,有利于理解物种形成的分子进化机制及其与自然选择的关系。得益于PacBio Revio测序系统的高通量高准确度优势,解除了通量限制,开启泛基因组研究高精度时代!

4. 罕见病队列基因组研究
罕见病诊断与研究,一直是基因组医学的核心任务之一。尽管短读长测序技术已经革命性改善了罕见病诊断与研究,但是基因组变异的复杂性,还是给我们带来了很多困难,尤其是复杂结构变异、串联重复、单体型分型、甲基化分析等内容,需要不同的技术手段进行分析,费时费力。通过PacBio Revio平台,我们可以轻松实现一次性测序,全面变异检测,将极大的提高罕见病诊断与研究的水平。为此,希望组不仅开发了专门分析三代测序的GrandVariants软件系统,还开发了dbSV/dbSTR大规模三代测序全基因组数据库,可以极大提高三代测序罕见病诊断与研究的效率。

让我们借助最新技术的应用,给生命带来希望!

预售热线
电话:15387037487
邮箱:inquiry@grandomics.com

平台升级 | 希望组HiFi产能扩大50%,交付快人一步!

为满足市场需求,给客户带来更高效更经济的服务,2022年4月22日希望组再次引进PacBio公司的最新Sequel IIe测序平台,HiFi产能扩大50%,目前,希望组已经累计构建PacBio Sequel/Sequel I I/IIe达12台。测序平台产能瓶颈解除之后,希望组将持续助力更多的动植物基因组完成图、三代群体重测序研究以及医学诊断等领域的研究与应用。

Sequel IIe真容

相较于以往Sequel II机型,Sequel IIe测序仪在测序原理上并无差别,但在硬件和软件上进行了一些改进和优化,用户可在Sequel IIe系统上直接获得高品质的HiFi 测序数据,总体上能够缩短用户近70%的下游分析时间,同时能够减少近90%的数据传送时间及节约相应的存储空间。与此同时,基于Sequel IIe测序仪的Read population可视化优化后可直接看到reads在长度和准确度上的空间分布情况及subread passes数对最终reads质量的影响情况,更快一步看到样本测序初步质量。

既快又好,希望组的HiFi测序数据质量及相应基因组组装结果是这样的!

1. 高产保质的HiFi测序

HiFi数据量和长度统计

近半个月来,希望组承接的40个HiFi测序项目中,除去个别特殊处理样本,每个cell的HiFi数据产出量均达25G以上!并且统计结果显示,产出数据的N50长度均能达到15kb左右,部分样本甚至可达20kb!

2. 快速高效的HiFi基因组组装

HiFi基因组组装统计

近期希望组完成的HiFi基因组组装案例,覆盖了真菌及各种大小型动植物,且组装的各项指标均达到预期!对最终组装结果进行BUSCO评估,用以评估基因组组装、基因集和转录本的准确性和完整性,各项目的BUSCO评估结果显示Complete BUSCOs 比例均达95%以上,相关基因组组装的完整性非常高!

3. HiFi宏基因组组装——HiFi测序应用的另一块高地

目前宏基因组测序方式主要是短读长的二代测序和长读长的三代测序。二代测序获得的宏基因组组装由于测序读长的限制,分析结果往往出现基因信息不完整、种群分类分辨率偏低、只能到属水平、组装连续性小等不理想状况。新升级的Pacbio Sequel II及Sequel IIe HiFi reads,兼顾长读长和高精准度,完全可以解决以上问题,通过长且准的测序方式提升组装完整性和连续性。HiFi宏基因组,在保证准确度和组装质量的前提下,提升了组装速度,为后续深入分析研究奠定基础。目前希望组正在基于华为云平台开发自动化分析流程,将进一步缩短分析流程,加快项目周期,为科研工作者和分析人员提供更便捷精准的平台,敬请期待!

基因组T2T完成图新工具丨BAC-long(>150Kb)测序技术正式推出!

2022年伊始,Nature杂志发布年度前沿技术展望,其中人类基因组T2T(端粒到端粒)完成图成为7大技术展望之首。

人类基因组T2T完成图

当Karen Miga和Adam Phillippy在2019年启动端粒到端粒(T2T)联盟时,大约有十分之一的人类基因组还没完全绘制出来,而今该数字已降至为零。该联盟2021年5月在BioRixv上发布的预印版中报道了第一个人类T2T基因组序列,有将近2亿个新的碱基对加入了广泛应用的人类基因组参考序列中,成为了一个全新的T2T-CHM13基因组版本,撰写了人类基因组计划的最终章。

从人类基因组端粒到端粒的完成图发布,到已发布的拟南芥基因组完成图,物种基因组完成图时代已经来临。

科学的进步一直伴随着技术的突破,人类基因组T2T项目的完成也不例外。近年来,长读长测序技术持续改进,陆续打破了传统的测序技术极限,成为了基因组T2T完成图组装的必备工具。其中,PacBio公司开发的HiFi测序技术,可以得到超过20Kb,准确度在99.9%以上的测序序列,成为了基因组组装领域的必备工具;ONT公司开发的Ultralong测序技术,可以将DNA测序长度扩展到N50 100Kb的极限,成为基因组T2T组装的首选技术。

但是,从人类基因组到模式生物基因组,以及逐步拓展到非模式生物基因组T2T组装,将面临更大的挑战:

1)二倍体基因组全染色体分型问题;
2)二倍体/多倍体基因组高杂合度问题;
3)超大基因组(>10Gb)带来的高重复问题;
4)超高/超长重复序列组装问题;
5)新进化产生的大片段重复(Segmental Duplications)识别问题;
6)一些复杂物种的大规模STR识别问题;
7)一些植物的高占比的着丝粒和端粒的识别问题;

这些问题的解决,也许需要采用比现有的人类基因组T2T项目更前沿的技术。

为了全面推动基因组组装进入T2T完成图时代,希望组(GrandOmics)历经近5年时间的持续研发,在逾10,000张ONT测序芯片的实战基础上,特别测试了超过1,200张超长DNA测序。在此基础上,研发出希望组自主知识产权的BAC-long(>150Kb)试剂盒,并正式面向全球提供BAC-long(>150Kb)测序服务。

测序技术里程碑——BAC-long测序

短读长组装到BAC-long组装

BAC文库构建可以插入平均150Kb的长片段DNA,是早期基因组组装的主要工具。2001年,人类基因组草图完成,国际人类基因组联盟主要采用的即是BAC-Based技术。每完成一个BAC的测序,都需要付出大量的人力、物力、时间和经费,最终整个项目整整持续了11年,花费超过了27亿美元。

2021年发布的CHM13-T2T人类基因组序列是研究者们耗时数年,利用长读长测序技术(PacBio平台的HiFi技术以及ONT平台的Ultralong(>100Kb)技术)完成的第一个零GAP人类基因组组装序列。但是,测序样本CHM13本身是加倍的单倍体,拥有几乎为零的基因组杂合度,难度远远低于普通的人类基因组二倍体,以及其他模式和非模式物种的T2T组装。

为了将真正的T2T基因组组装,从人类基因组拓展到更为广阔的领域,包括动植物基因组、农业育种、医学研究、濒危物种保护等,将T2T基因组组装树立为新的行业标准,希望组正式推出BAC-long试剂盒——直接测序即可获得近乎BAC插入片段长度,提供测序读长N50超过150Kb的BAC-long reads,从而可以让测序长度更长,更容易跨过端粒、着丝粒等复杂重复区域,在基因组组装中的表现更优越,为每个物种的基因组完成图助力。

以下为近期希望组BAC-long项目中某植物、某动物的测序reads分布图,显示reads长度更长。

想要获得基因组完成图,除了需要BAC-long reads,跨越复杂重复区域,降低基因组组装拼接难度外,还需要相匹配的完成图组装软件。希望组特地为用户匹配了NextDenovo 2.0系列组装软件,彻底解决完成图组装的后顾之忧。

敬请关注希望组升级软件NextDenovo 2.0!

武汉希望组被认定为湖北省专精特新“小巨人”企业

12月24日,湖北省经济和信息化厅公布了“湖北省第三批专精特新‘小巨人’企业名单”,经各市州经信部门初核和推荐、专家评审及社会公示等程序,全省共有1025家企业被授予“湖北省专精特新‘小巨人’企业”称号,武汉希望组生物科技有限公司(“希望组”)成功入选。
“专精特新”主要集中在新一代信息技术、高端装备制造、新能源、新材料、生物医药等中高端产业,科技含量高、设备工艺先进、管理体系完善,市场竞争力强,专精特新在中小企业创新转型中发挥较好的示范引领作用。
1、“专”是指采用专项技术或工艺通过专业化生产制造的专用性强、专业特点明显、市场专业性强的产品。其主要特征是产品用途的专门性、生产工艺的专业性、技术的专有性和产品在细分市场中具有专业化发展优势。
2、“精”是指采用先进适用技术或工艺,按照精益求精的理念,建立精细高效的管理制度和流程,通过精细化管理,精心设计生产的精良产品。其主要特征是产品的精致性、工艺技术的精深性和企业的精细化管理。
3、“特”是指采用独特的工艺、技术、配方或特殊原料研制生产的,具有地域特点或具有特殊功能的产品。其主要特征是产品或服务的特色化。
4、“新”是指依靠自主创新、转化科技成果、联合创新或引进消化吸收再创新方式研制生产的,具有自主知识产权的高新技术产品。其主要特征是产品(技术)的创新性、先进性,具有较高的技术含量,较高的附加值和显著的经济、社会效益。

GrandOmics + Sentieon丨希望组与Sentieon联手打造长读长测序数据分析新工具

近日,北京希望组与Sentieon联合宣布,双方决定在基因组数据分析的多个领域进行战略合作,持续推动包括二代和三代测序在临床诊断的产品落地。

双方合作的重点包括了以下四点:

1.联合推出基于PacBio HiFi数据的基因组重测序分析流程,变异检测范围包括了SNP,Indel和SV(结构变异);2.面向ONT最新推出的Q20+最新试剂数据,双方将进一步联合开发全面覆盖SNV/Indel/SV的变异检测产品;

3.验证并部署基于Sentieon已经完成的MGI数据全基因组(WGS)分析流程;

4.将双方的合作纳入“希望诊断计划”,为该计划开发并搭建全方位的长、短读长结合的大数据变异分析平台。

GrandOmics长读长数据SV检测软件——GrandSV

高质量的结构变异检测,是基因组医学的基石,无论是针对罕见病、肿瘤,还是辅助生殖,各种基因组医学的应用,均急切的需要新型的工具解决复杂的基因组结构变异检测问题。

长读长测序对于大片段的结构变异检测具有天然的优势。综合长读长数据分析算法中的序列拼接和序列比对算法,希望组开发了针对于长读长测序数据(PacBio HiFi和ONT)的SV检测软件——GrandSV。和以往长读长数据SV检测软件相比,兼顾了两种特征鲜明、截然不同的长读长数据(PacBio HiFi/ONT),具有更高的准确度和灵敏度。

利用准确度在99%左右的PacBio HiFi模拟数据来评估GrandSV与同类型软件cuteSV v1.0.9,Pbsv v2.4.0,Sniffles v1.0.12在人类基因组上鉴定结构变异(SV)以及变异分型(Genotyping)的准确性和灵敏度。图1的结果显示,GrandSV在5-30X的不同深度上效果都是最好的之一。此外,模拟Super Accuracy basecalling模式下的ONT数据分析结果也同样显示出了GrandSV的不俗表现。

图1. Benchmark with simulated PacBio HiFi and ONT (SUP model) data

除模拟数据外,基于HG002的PacBio HiFi和ONT真实数据,并以Genome in a Bottle Consortium (GIAB) 团队发表的34,830个高置信区间当做真实的背景数据集来评估GrandSV表现。结果依然显示GrandSV的整体效果在5-30X的不同深度上都是最优的之一。

图2. Benchmark with HG002 PacBio HiFi and ONT data

相较于其他长读长SV检测软件,GrandSV有着更高的灵敏性。图3是HG002中一个长的片段插入,由于测序reads太短,单条read无法跨过,导致其他的软件在此处只能检出断点,而GrandSV通过局部组装可以完整的组装出跨过这个SV的一致性序列。图4是HG002中两个杂合的片段插入,其他软件只能检测出一个平均长度约94bp的片段插入,而GrandSV能够准确检测出两个不同的杂合的片段插入。

图3. Only GrandSV called correctly for a 9562 bp INS

图4. Only GrandSV called correctly for a 60 bp INS and a 122 bp INS

Sentieon三代PacBio HiFi数据SNP/Indel检测软件——DNAscope LongReads

Sentieon在二代测序中SNP/Indel变异检测流程已非常成熟,并以其检测准确性高和检测速度快而广受业内人士认可。近日,Sentieon推出了DNAscope LongReads分析流程,深度改进DNAscope流程,加入Sentieon分型(Phasing)模块,高速准确分析PacBio HiFi数据进行SNP/Indel检测。

DNAscope LongReads运算效率高,速度相比开源软件有很大的提升。其中比对模块Sentieon Minimap2与原版相比提速2倍,而变异检测模块与DeepVariant相比提速6倍,有助于用户提升交付速度,降低计算成本。

准确度方面,DNAscope LongReads流程获得了FDA挑战赛PacBio数据的两个分项冠军,SNP的F1 score达到了0.9993,Indel为0.9943。在低深度下对比10x PB HiFi,16x PB HiFi,30x Illumina的全基因组测试结果,可以发现全基因组范围内16x的HiFi数据的准确率就已经超越了30x Illumina的数据,在低复杂度的基因组区域内即使10x的HiFi数据也可以超越Illumina的准确度。

图5. SNP and Indel accuracy on HG003 WGS Data, PB HiFi vs ILMN

长读长数据可以覆盖Illumina序列所无法覆盖的区域,例如395个位于常染色体上复杂区域的临床相关基因(CMRG)。这些基因具有重要的临床价值,然而由于所处基因组区域较为特殊,短读长序列难以比对。以SMN1基因为例,该基因是脊髓性肌萎缩症的致病基因,最常见的突变是外显子7和8的缺失。从下图可以看出,只有PB HiFi数据可以覆盖相关区域,得出变异检测结果。

图6. PB HiFi covers SMN1 gene region when ILMN reads fail

通过结合双方在长读长变异检测流程中的特有优势,将点突变及大片段的结构变异整合分析,推出的完整HiFi全基因组重测序分析流程,将极大地加快PacBio HiFi测序的临床应用。基于本次成功经验,在未来,双方团队还会在Oxford Nanopore的数据处理上进行合作,为业界带来更多优质的Long Reads重测序的分析流程。同时双方也会持续在其他领域包括华大测序平台应用,以及“希望诊断计划”项目中保持合作,共同加速全基因组临床产品的市场教育和推广工作。

希望组荣膺“2021中国医疗创新力企业TOP10”

10月11日-13日,“天府健谈·CHS 2021第六届中国大健康产业升级峰会”召开,本次峰会由中国卫生信息与健康医疗大数据学会全科医学与健康管理工作委员会、亿欧EqualOcean主办,四川省卫生健康委、中国卫生信息与健康医疗大数据学会指导。

会上重磅发布了2021中国数字医疗企业百强榜系列榜单,经过历时数月的评选,拥有丰厚三代测序应用与发展的希望组凭借三代测序在临床医疗诊断产品上的不断创新,从众多企业中脱颖而出,成功入选“2021中国医疗创新力企业TOP10”。