希望组与Bionano合作开展COVID-19感染患者基因组变异研究

Bionano 将用于鉴定导致冠状病毒疾病易感性的基因变异的研究

第一项研究将在中国武汉进行;欧洲和北美的研究有望紧随其后

圣地亚哥,2020年3月10日(全球新闻)-Bionano Genomics宣布启动COVID-19感染患者基因组变异的全球研究网络,本研究旨在确定影响COVID-19疾病抵抗力,敏感性,疾病进展和药物反应的基因组变异。第一项研究将在中国武汉进行,Bionano服务提供商希望组将与Bionano Genomics合作开展。至少有100名COVID-19感染检测呈阳性的患者将使用Bionano Saphyr系统进行全基因组分析,并将比较无症状或轻度症状的患者和有严重疾病的患者的基因组变异。这项研究将控制病毒株的差异,以及已知的年龄和慢性疾病的危险因素,如心脏病、糖尿病或其他影响免疫系统的疾病。
Bionano Saphyr系统在极长的基因组DNA分子上标记荧光并成像,以识别结构变异。尽管Bionano的技术并不适合于病毒检测本身(通常通过PCR测定进行检测),但Saphyr能独特的检测人类基因组中的结构变异。这种变异可能使个体易于出现轻微或严重的疾病进展,或对病毒具有抗性。此外,某些变异可能决定个体对药物治疗的反应。
基因组变异与疾病抗性和疾病进展的关系已在多种传染病中得到证实。α-球蛋白基因的缺失会导致镰状细胞性贫血,但可以预防疟疾感染。CCR5基因中的一个结构变异提供了针对艾滋病病毒感染的保护,这一发现导致一些患者被治愈,他们接受了来自携带这种变异的捐赠者的骨髓移植。在IL28B位点的遗传变异使携带者在药物治疗后根除丙肝病毒的机会比那些没有这种遗传变异的携带者大3倍。主要组织相容性复合体(MHC)位点(约有150个基因的基因簇)的结构变异与对多种传染病的抗性有关。Saphyr可以对人MHC位点的等位基因进行特异的分析和分相。
最近的研究表明,COVID-19和SARS-CoV(导致SARS爆发的冠状病毒)都与血管紧张素转化酶2(ACE2)基因相结合从而进入细胞。Bionano研究将探究ACE2周围区域可能影响病毒结合的结构变异和拷贝数变异,分析患者的MHC区域,并使用Saphyr无偏倚的全基因组范围检测能力,试图找到尚未确定的疾病易感性基因。专家们一致认为,对宿主反应范围的调查对于确定如何最好地抗击该疾病并防止今后爆发类似性质的疾病至关重要。
Bionano Genomics首席执行官Erik Holmlin博士表示:“作为一家在结构变异检测方面处于领先地位的生命科学公司,我们相信,我们有责任帮助阻止这一致命的毁灭性的流行病。Bionano的基因组成像技术比任何基于测序的方法都能更好地识别基因组结构中的变异,这使我们处于独特的位置,可以帮助识别基因组中的变异,从而保护患者免受病毒感染或使其易于感染。我们已经在全球范围内开展了识别这类变异的研究,并很高兴地宣布将在最初的疫情中心武汉开展的这些研究中的第一项。我们计划将这些发现提供给科学和公共卫生界,并希望我们能够为疫苗或药物开发、更好的患者分流和治疗以及疾病和流行的全面管理做出贡献。”
希望组首席执行官汪德鹏表示:“我们很高兴与Bionano合作,将Saphyr用于这项重要研究。由于我们在武汉设有临床实验室,因此GrandOmics与COVID-19战斗的前线的临床医生和研究人员有着独特的联系。我们收集的患者样品越来越多,具有涵盖一系列结果的全面临床历史。我们相信,该样本库与Saphyr的独特能力结合在一起,将为疾病当前的爆发以及未来的潜在爆发提供深刻的见解。”
关于Bionano Genomics
Bionano是一家基因组分析公司,基于Saphyr系统向从事基因研究和患者测试的科学家和临床医生提供工具和服务。Bionano的Saphyr系统是用于超灵敏和超特异结构变异检测的平台,使研究人员和临床医生能够加快寻找新的诊断和治疗靶标的速度,并简化染色体变化的研究,这被称为细胞遗传学。Saphyr系统由仪器,芯片耗材,试剂和一组数据分析工具以及基因组分析服务组成,Bionano数据可通过使用Saphyr或通过遍及全球的检查服务获得。更多信息,请访问www.bionanogenomics.com。
>>>>
Bionano安全港声明
本新闻稿包含1995年《私人证券诉讼改革法案》所定义的前瞻性陈述。诸如“可能”,“将”,“期望”,“计划”,“预期”,“估计”,“打算”等词语。”和类似的表述(以及引用未来事件,条件或情况的其他词语或表达)传达了未来事件或结果的不确定性,旨在识别这些前瞻性陈述。前瞻性陈述包括关于我们的意图,信念,预测,前景,分析或当前期望的陈述,其中包括有关本新闻稿中讨论的研究的设计和结果,在这些研究中计划使用Saphyr以及Saphyr的贡献对COVID-19的研究,以及潜在的见识和我们的能力对疫苗或药物开发的贡献,更好地对患者进行分类和治疗,以及对COVID-19大流行进行全面管理。这些前瞻性陈述均涉及风险和不确定性。实际结果或发展可能与这些前瞻性陈述中预测或暗示的有重大差异。可能造成这种差异的因素包括Saphyr可能无法达到预期效果的风险;可以预防或防止患者受到病毒感染的基因组变异可能未被发现;在我们的研究结果发布之前,可能已遏制了COVID-19大流行;引入竞争产品;我们获得足够资金以资助我们的努力的能力;以及与我们的业务和财务状况有关的风险和不确定性,包括我们向美国证券交易委员会提交的文件中所述的风险和不确定性,包括但不限于我们截至2018年12月31日止年度的10-K表年度报告以及我们随后向美国证券交易委员会提交的其他文件佣金。本新闻稿中包含的所有前瞻性陈述仅在做出陈述之日讲,并基于该日管理层的假设和估计。无论是由于收到新信息,未来事件的发生还是其他原因,我们都不承担公开更新任何前瞻性陈述的义务。2018年以及我们随后向美国证券交易委员会提交的其他文件中。本新闻稿中包含的所有前瞻性陈述仅在做出陈述之日讲,并基于该日管理层的假设和估计。无论是由于收到新信息,未来事件的发生还是其他原因,我们都不承担公开更新任何前瞻性陈述的义务。2018年以及我们随后向美国证券交易委员会提交的其他文件中。本新闻稿中包含的所有前瞻性陈述仅在做出陈述之日讲,并基于该日管理层的假设和估计。无论是由于收到新信息,未来事件的发生还是其他原因,我们都不承担公开更新任何前瞻性陈述的义务。

*本文基于Bionano Genomics公司官方网站新闻”Bionano Genomics Will Be Used in Research Identifying Gene Variantsthat Contribute to Coronavirus Disease Susceptibility”翻译。

项目文章两连发||三代测序助力药用动物圆点斑芫菁、菲牛蛭基因组草图组装

近日,由陕西师范大学许升全教授团队主导的圆点斑芫菁基因组文章“Draft Genome of a Blister Beetle Mylabris aulica”和菲牛蛭基因组文章“Draft Genome of the Asian Buffalo Leech Hirudinaria manillensis”在frontiers in Genetics期刊发表。陕西师范大学许升全教授和黄华腾教授为圆点斑芫菁基因组文章的共同通讯作者。陕西师范大学许升全教授、王喆之教授和西北工业大学邱强教授为菲牛蛭基因组文章的共同通讯作者。武汉未来组作为两篇文章的共同作者,承担了圆点斑芫菁和菲牛蛭的三代测序及分析工作。下面就由组学君给大家带来这两篇文献的解读吧~
文章一——圆点斑芫菁基因组揭示斑蟊素合成机制
题目:Draft Genome of a Blister Beetle Mylabris aulica [1]
发表期刊:frontiers in Genetics
合作单位:陕西师范大学
测序方法:纳米孔测序
圆点斑芫菁(Mylabris aulica)属鞘翅目芫菁科,也称为斑蝥。其受到袭扰后能产生一种具有刺激性的防御物质斑蝥素(Cantharidin),具有抗炎、抗病毒、增强免疫调节活性的作用。最新研究表明斑蝥素及其衍生物能够抑制多种类型癌症的增殖,但其人工合成因为条件苛刻一直无法工厂化生产。目前对芫菁科昆虫体内斑蟊素的合成机制研究主要是用比较转录组的方法推测可能的相关基因,但代谢通路完全不清楚。
研究者利用纳米孔测序技术组装出288.5 Mb的圆点斑芫菁的基因组,scaffold N50为467.8kb,预测的重复序列占50.62%,BUSCO完整性评估达97.9%,相比已经报导的两种已知斑蝥基因组,该组装连续性、完整性都得到了极大提升。根据基因组数据对圆点斑芫菁的遗传背景进行分析,表明圆点斑芫青与其他芫菁科昆虫基因背景几乎完全相同,分化时间也极短。随后研究者在“萜烯类主链生物合成”途径中发现了30个基因家族,它们参与了斑蝥素的生物合成,并且对其中两个功能未知的基因BMGene00496和BMGene01890进行了功能注释。
总之,本研究利用纳米孔测序技术组装出了圆点斑芫菁的基因组草图,对斑蝥素生物合成相关的可能基因和途径进行了分析,为后续圆点斑芫菁研究以及斑蝥素生物合成提供了宝贵资源。

萜类生物合成“KEGG通路图”,绿色方框基因在圆点斑芫菁基因组中发现。

文章二——菲牛蛭基因组揭示水蛭素合成机制
题目:Draft Genome of the Asian Buffalo Leech Hirudinaria manillensis[2]
发表期刊:frontiers in Genetics
合作单位:陕西师范大学、西北工业大学
测序方法:PacBio SMRT
菲牛蛭(Hirudinaria manillensis)也称亚洲水蛭,广泛分布于东南亚的水生食血物种,是中国药典收录的3种药用水蛭中个体最大、吸血能力最强的一种。抗凝血物质水蛭素的生物合成是菲牛蛭最重要的特征,促进了其在临床放血等方面的应用,但是水蛭素合成相关基因及遗传背景完全缺失。
研究者选取成年菲牛蛭的肌肉组织为样本进行测序,组装出的基因组大小为151.8 Mb,scaffold N50为2.28Mb,BUSCO评估达93.7%,表明该组装基因组质量较高。基于RepeatMasker 和RepeatModeler,预测该基因组含有19.52%的重复元素。结合Ab initio预测和同源比对预测,共预测到21,005个编码蛋白基因,其中注释到的功能基因有17,865个。抗凝血物质生物合成是菲牛蛭最重要的特征,研究者检测了菲牛蛭基因组中具有水蛭素和抗凝素结构域的抗凝蛋白,最终鉴定到16个蛋白中含有水蛭素或抗凝素结构域。进一步的比较基因组分析显示,菲牛蛭合成水蛭素与已知水蛭素蛋白质序列虽存在差异,但空间结构变异较小,行使相同分子功能,未经历快速进化。
总之,本研究利用PacBio测序技术组装出首个菲牛蛭的基因组,并鉴定出16个含有水蛭素或抗凝素结构域的蛋白。这些数据将有助于进一步了解菲水蛭的生物学机制和遗传特性,并为今后的研究提供宝贵的资源。

2抗凝素结构域在菲牛蛭基因组contig00006 上的分布。
参考文献:
[1] Guan D L, Hao X Q, Mi D, et al. Draft genome of a blister beetle Mylabris aulica[J]. Frontiers in Genetics, 2019, 10: 1281.
[2] Guan D L, Yang J, Liu Y K, et al. Draft Genome of the Asian Buffalo Leech Hirudinaria manillensis[J]. Frontiers in Genetics, 2020, 10: 1321.

项目文章||芡实与金鱼藻三代基因组揭示早期被子植物演化

2020年2月24日,国际著名植物学研究期刊Nature Plants发表了题为”Prickly waterlily and rigid hornwort genomes shed light on early angiosperm evolution”的文章,该研究公布了被子植物的两种早期演化分支代表种:芡实和金鱼藻的染色体水平基因组序列,通过与其它代表性陆生被子植物代表基因组进行了深入的比较分析,揭示了早期被子植物的复杂演化历史。来自四川大学的杨勇志(现为兰州大学青年研究员)和华北理工大学的孙朋川是论文的并列第一作者;四川大学教授刘建全、席祯翔,华北理工大学教授王希胤、哈佛大学教授 Charles C. Davis是论文的通讯作者;刘建全教授为该项目的总负责人。武汉未来组承担了芡实和金鱼藻的纳米孔测序工作。
被子植物,或称开花植物,是地球上多样化程度和物种丰富度最高的类群之一,早期被子植物的突然出现和迅速多样化使被子植物的起源成为著名的达尔文“讨厌之谜”。几十年的努力已经极大地解决了被子植物的系统发育问题,但是主要分支之间的演化历史始终存在争议。例如,核心被子植物的五大类群之间的系统发育关系仍存在模糊不清的地方。核心被子植物包含约99%的现存被子植物,分为真双子叶植物、单子叶植物、木兰类植物、金鱼藻目以及金粟兰目五大类群,现有研究根据不同的形态学或分子层面证据,提出了不同的发育分支拓扑结构。
基因组数据能够提供更加丰富和有说服力的证据来解决物种进化分歧问题。本研究采用三代Nanopore长读长测序数据和二代illumina短读长数据,分别组装出芡实(725.23Mb, Contig N50=4.75 Mb)和金鱼藻(733.26Mb, Contig N50=1.56 Mb)的基因组序列,随后结合Hi-C数据,将基因组提升至染色体级别。评估表明两个基因组显示了高度的连续性、完整性和准确性(图1a),并与细胞学研究中获得的染色体数目相匹配。
随后研究者在芡实基因组中检测到两个多倍化事件,校正进化速率之后,估计芡实基因组中的两个多倍化事件分别发生在大约16-18百万和94-106百万年前(Ma)。在金鱼藻中检测到三个多倍体化事件,估计分别发生在大约13-15 Ma,127-143 Ma和157-177 Ma。并且被子植物的五个主要演化分支,金鱼藻、睡莲类、木兰类、单子叶植物和真双子叶植物中都发生了多个独立的多倍化事件(图1b),并且芡实最近还经历了一次基因组加倍。

图1 比较基因组分析。a芡实和金鱼藻基因组特征; b平均同义替换水平(Ks)在同位块间的分布。
研究者从13种被植物和1种裸子植物基因组序列中鉴定出1,374个单拷贝核基因用于构建系统发育树,首次涵盖两个基础被子植物类群(无油樟目无油樟、睡莲目芡实)以及核心被子植物五大类群中的四个(4个真双子叶植物,3个单子叶植物,3个木兰类植物,金鱼藻目金鱼藻)。采用两种方法连接并分析蛋白质编码区获得了两个数据集(SSCG-CDS 和SSCG-Codon12)构建进化树表明,无油樟和睡莲类依次是其他被子植物的姐妹群,同时推测金鱼藻是真双子叶植物的姐妹群(图2a,b)。同时,研究者还利用OrthoMCL方法和新开发的物种发育树构建方法STAG证实了上述结论的可靠性(图2a)。
随后研究者使用DensiTree 对SSCG-CDS和SSCG-Codon12两个发育树进行可视化,发现二者存在普遍的拓扑冲突(图2c),无油樟目和睡莲目之间的拓扑分支冲突和金鱼藻系统发育位置的矛盾(图2d)。并且无油樟目和睡莲目的系统发育位置在基因树和物种树之间存在大量不一致(图2e)。这些分析表明,在早期被子植物进化过程中可能存在大量的不完全谱系分选(ILS),造成主要分支之间基因树、或核基因组-叶绿体基因组系统发育树分支关系不一致。
          

图2 早期分化被子植物的系统基因组分析。a 基于MCMCTree推断的SSCG-CDS数据集的被子植物早分化年表;b DiscoVista物种树分析;c SSCG-CDS(红色)和SSCG-Codon12(橙色)叠加超矩阵基因树。d SSCG-CDS和SSCG-Codon12中物种树内部分支的三种拓扑的频率(q1-q3)。e 基因树的兼容性
总之,本研究组装出了两个早期水生被子植物——芡实和金鱼草的高质量染色体水平基因组,结合其他代表性被子植物主要类群,利用多个数据集和多种方法,深入解析了被子植物的早期演化以及不同类群之间的系统发育关系。这些发现有助于研究被子植物中主要分支的演化次序和生境转变、植物生命之树重建,特别是水生被子植物适应性演化、不同类群的古多倍化等复杂进化历史。
参考文献:
Yang Y, Sun P, Lv L, et al. Prickly waterlily and rigid hornwort genomes shed light on early angiosperm evolution[J]. Nature Plants, 2020: 1-8.

疫情防控利器——希望组全长新型冠状病毒(2019-nCoV)试剂盒研制成功,实时监控病毒演化与变异即将成为现实

2019年12月,武汉出现不明原因肺炎,2020-01-12日,世界卫生组织正式将造成此次疫情的新型冠状病毒命名为“2019新型冠状病毒(2019-nCoV)”。近一个月来肺炎疫情发展迅猛,截至2020-01-30 24:00 全国已确诊患者9692例,疑似患者15238例,而作为疫区核心的武汉已有2639名确诊病例(数据来源:人民日报)。
疫情的蔓延,让我们心急如焚,作为国内首家基于第三代测序技术的精准医疗公司,尤其是作为一家武汉本地企业,我们也热切的期待能贡献自己的一点点微薄的力量。公司在疫情爆发期间动员了核心研发团队,紧急攻关,开展基于第三代单分子新诊断技术的研发。疫情爆发之后,国内众多精准医疗同行纷纷紧急动员,彻夜奋战,研发出各种基于RT-PCR(和胶体金试纸)的检测技术以及产品,大大缓解了疫情初期新冠状病毒检测通量的压力,对新冠状病毒的传播和控制做出卓越的行业贡献。我们和所有同行一样心系人民的健康,同仇敌忾,团结奋战,共抗病毒。打好病毒歼灭战,不仅需要对已知病毒进行的检测,更重要的是从源头进行防控,这包括对病毒演化和变异以及对其他已知和未知的致病病毒和细菌进行机动和实时的监控和研究。这通常是疫情战役最容易忽视和遗漏的一环。为此,我们的研究团队充分利用第三代单分子测序技术的优势,将重心放在以下几点:
1. 病毒的实时检测和分析2. 利用5G技术支持临时隔离区域或者机动实验室进行云计算检测和分析

3. 开发基于全长基因组的病毒演化和变异检测技术

截止2020-01-30日,我们终于完成了基于纳米孔测序技术的新型冠状病毒(2019-nCoV)核酸全长检测试剂盒,以及基于纳米孔测序技术的宏基因组病原体检测方法。
该试剂盒采用多重PCR对病原体核酸进行扩增后使用纳米孔测序仪进行测序,将得到的核酸序列与已知病原体序列对照确定病原体类型。纳米孔测序技术克服了传统NGS测序平台对样本制备、场地要求、运行时间长等限制性特点,具备实时、长读长、运行时间短、文库构建简单等优势。宏基因组病原体检测方法能够对快速演化的病原体以及其他未知的病原体进行检测。

我们和华为5G和华为云团队一起完成了实时机动的测序数据的上云传输和计算实验,能够确保在没有固定IT基础设施的临时区域或缺少有线网络和本地计算资源的地点能够通过无线网络进行病原体的检测和分析。

目前,新冠状病毒防控已经处于非常关键的时期,除了要快速、及时、高效的对疑似病例进行确诊以外,一个不容忽视的防控方向是进行病毒演化和变异的监控,希望组新试剂盒和宏基因组检测技术的推出,可以在疫情防控的关键阶段,提供非常重要、关键的技术支持。

希望组武汉测序中心通过ISO9001:2015质量管理体系认证

2020年1月6日,SGS授予希望组集团旗下武汉未来组生物科技有限公司(以下简称希望组武汉测序中心)证书,证明其在提供高通量测序和生信分析服务领域正式通过ISO9001:2015质量管理体系认证。
为了向客户提供持续满意的服务,实现全面的质量管理。希望组武汉测序中心从年初开始筹备ISO9001质量管理体系的建立,并于7月11日按照GB/T 19001-2016/ISO 9001:2015体系要求发布实施质量管理体系程序文件,规范公司产品服务、过程质量控制、持续改进等工作。经过近半年的运行,12月26日迎来了SGS评审专家小组,审核小组专家深入公司领导层、营销中心、项目部、生产部、生信部、IT中心、采供部、人事行政部等相关部门,对公司ISO9001质量管理体系的建立、运行情况进行了审核。
 
经过两天的现场审核,审核小组对希望组武汉测序中心ISO9001质量管理体系的建立、运行进行了综合评价。审核组专家认为,希望组武汉测序中心的管理、检测及服务全过程质量管理体系运行良好,密切关注客户需求,不断向全体员工贯彻过程质量控制的重要性,能有效降低风险并稳定地为客户持续提供满意的服务,提升客户满意度。公司在质量方针提供的框架下,在相关职能和层次上建立了质量目标,能够体现对产品和服务质量的追求,各项质量目标基本实现,满足GB/T 19001-2016/ISO 9001:2015的基本要求。
2019年12月27日,希望组武汉测序中心顺利通过SGS专家的现场评审。2020年1月6日,希望组武汉测序中心正式获得《ISO9001:2015质量管理体系认证证书》。
ISO9001认证强调以客户为中心的理念,明确公司通过了解客户的要求,通过体系中各个过程的运作满足客户要求甚至超越客户要求,并通过客户满意度的调查来获取客户的满意程度,以不断提高公司在客户心中的地位,增强客户的信心。
ISO9001质量管理体系的有效运行和认证通过,将有力促进希望组三代测序服务质量的提升,我们也将继续以更高的要求,不断完善质量管理体系,为客户创造更高的价值!

云 +AI 赋能三代基因测序,希望组荣获华为云年度峰会“选择不凡奖”

1月8日,“选择不凡 华为云年度峰会2020”在北京钓鱼台国宾馆盛大开幕。此次峰会,华为携手各领域众多合作伙伴,共同探讨“云+AI+5G”技术融合如何成为开启智能经济的技术使能密码,实现共创共享共赢,推动数字经济进入一个崭新的智能时代。希望组作为华为基因测序领域合作伙伴,荣获“选择不凡奖”。
 
作为目前应对遗传疾病最有效的手段之一,基因测序的落地应用,为更多家庭带去了新希望,但随着基因测序技术的不断更新迭代,海量基因数据的挖掘、存储、分析等都成了测序企业的巨大考验。以人类基因组为例:23对染色体,31.6亿个碱基对,一次30倍的全基因组测序的数据量大约200Gb,基因转换、拼接、对比、注释全流程,用一台高性能服务器运行耗时30多个小时。数万/数十万个基因测序任务,对网络、存储、算力及业务响应的及时性、可靠性、安全性有极高的要求。
 
为解决面临的问题,2018年12月6日,希望组&未来组与华为深度交流并签署战略合作协议,发挥华为云在计算、存储、网络等领域的技术优势,利用希望组&未来组三代测序平台和产品,努力攻克技术壁垒,通力打造适用三代测序技术的智能化平台。

经过近一年的充分沟通、探讨和测试,2019年11月14日,希望组与华为云共同打造的精准基因组分析容器化解决方案架构 Hanwell正式发布,Hanwell 在实践中有得天独厚的优势,该方案具备的多引擎接入、高性能容器批量计算等特点 , 更好地解决了大规模群体基因组分析所面临的困难,让资源控制更加精细化。同时整个解决方案还提供了资源审计、项目监控和资源管理三个功能,比传统的 HPC 的方案耗时减少了 20%、成本下降了 30%。
得益于希望组—华为云基因测序计算平台提供的计算支持,在医学领域希望组已建立最大的中国人群全基因组结构变异数据库—dbSV100K,库内样本数量已超过 gnomAD ( 全球最大的变异数据库 )东亚人群样本数。该数据库将为挖掘基因组结构变异对人类疾病影响提供可行的机遇,以期最终提供临床基因诊断服务。
希望组与华为云的强强合作,开启了用信息技术探索基因奥秘的新篇章,用技术的温度为人类和社会带去积极改变,让未诊断的被诊断,让生命充满希望!

希望组三代测序助力特发性震颤相关致病基因发现

近日,国家老年疾病临床医学研究中心(湘雅)、中南大学湘雅医院神经内科唐北沙教授、郭纪锋副教授团队在国际神经病学领域权威期刊《Brain》(IF:11.814)以论著形式在线发表了题为“Expansion of GGC repeat in human-specific NOTCH2NLC gene is associated with Essential Tremor”原创性论文[1]。该研究在国际上首次揭示了NOTCH2NLC基因GGC异常重复扩增与特发性震颤(ET)相关。中南大学湘雅医院郭纪锋副教授和唐北沙教授为该论文并列通讯作者,孙启英博士和徐倩博士为共同第一作者。北京希望组承担了该研究中Nanopore长读长测序和分析工作。
特发性震颤(Essential tremor, ET)是最常见的运动障碍疾病之一,典型症状为双上肢4-12Hz的动作性震颤,可伴有下肢、头部、口面部或声音震颤。特发性震颤的患病率随着年龄的增长而急剧增加:在65岁以上的人群中,有约4.6%的患者;在95岁以上的人群中,有约20%的患者。尽管ET具有很高的发病率和家族聚集性,其致病基因和发病机制仍不明确。
 
本研究中唐北沙教授、郭纪锋副教授团队首先对两个ET家系应用连锁定位、单体型分析将其致病基因定位于染色体1p13.3-q23.3,在全外显子测序(whole-exome sequencing,WES)未找到可疑致病突变后,应用Nanopore长读长测序技术发现区间内NOTCH2NLC基因5’端GGC异常扩增(图1)。进一步应用RP-PCR、GC-PCR分析发现,这两个家系中所有ET患者GGC扩增次数(平均108.67±22.24)远高于未受ET影响的成员(平均14.60±4.28),表明NOTCH2NLC基因5’端GGC异常扩增与这两个ET家系存在共分离现象。随后,在另外195个中国ET家系中发现NOTCH2NLC基因5’端GGC异常重复扩增与9个ET家系存在共分离,提示NOTCH2NLC基因5’端GGC异常重复扩增可能是ET新的相关致病基因。
                                         
图1 通过连锁分析结合三代测序发现两个ET家系中NOTCH2NLC基因5’端GGC异常重复扩增。A 两个ET家系;B 遗传连锁分析;C Nanopore电信号显示异常重复扩增(3/4);D Family 1: III10患者的NOTCH2NLC基因5’端GGC异常重复扩增。
值得一提的是,此前沈璐教授、唐北沙教授团队在国际上首次报道了神经元核内包涵体病(NIID)致病机制与NOTCH2NLC基因中GGC异常重复扩增相关[2],该研究同样是利用Nanopore长读长测序技术检测到致病基因,希望组参与了其中长读长测序和分析工作。Nanopore长读长测序技术能检测出二代测序无法覆盖到基因组上的复杂区域,如串联重复、结构变异等,在遗传病诊断领域具有深远的发展前景。
参考文献:
[1] Sun Q Y, Xu Q, Tian Y, et al. Expansion of GGC repeat in the human-specific NOTCH2NLC gene is associated with essential tremor[J]. Brain, 2019.
[2] Tian Y, Wang J L, Huang W, et al. Expansion of Human-Specific GGC Repeat in Neuronal Intranuclear Inclusion Disease-Related Disorders[J]. The American Journal of Human Genetics, 2019.

超级植物-蕨类的三代基因组攻略:ONT超长+Bionano Gen2+Hi-C+NextDenovo

超级植物

蕨类在地球上已经存在了3.35亿年,是现存最古老的植物之一。远在恐龙出现和大陆漂移之前,它们便占据着原始大陆的沼泽森林,通过羽状叶片储存大量太阳能。蕨类死亡后的遗骸被埋葬在泥泞的沼泽沉积物中,经过千万年压缩转化成当代工业革命的能量——煤。

蕨类:基因组,够大;染色体数,够多!

蕨类具有重要系统发育地位,尽管蕨类的基因组数据量仍然有限,但现有数据强烈表明,它们的基因组动力学与所有其他陆地植物截然不同。蕨类基因组的典型特征是染色体数目多这被认为是通过多倍体的多个全基因组复制(WGD)周期产生的。然而,与被子植物多倍体相比,蕨类的多倍体后二倍体化过程通常涉及基因沉默而不是DNA消除,从而导致染色体数目异常增多,同时保持二倍体基因的表达[1]。蕨类染色体的平均数目(n = 63.5)[2]是被子植物平均数目的三倍多(n = 21.55)[3]而蕨类基因组大小平均为12Gb[3],最大甚至达到148Gb[4,5]

蕨类基因组研究现状

对蕨类基因组结构和功能的研究,有利于深入研究其多倍性和染色体进化问题。然而,由于短读长测序组装的技术瓶颈,造成蕨类的基因组测序工作长期止步不前迄今为止,仅测序了满江红(Azolla filiculoides,0.75Gb)和勺叶槐叶萍(Salvinia cucullata,0.26Gb)两个小基因组蕨类[7]。由于缺少参考基因组信息,对蕨类的分子生物学研究也远远落后于其他类型的植物,尤其是种子植物。
测序技术的发展以及成本的降低使基因组测序变得越来越容易,但对于基因组普遍较大的蕨类,有必要仔细计划测序策略并决定对哪些物种测序。最近,康奈尔大学博伊斯汤普森研究所的研究人员统计了最新的蕨类基因组大小数据,并确定了18个跨越蕨类进化树的中型基因组,作为未来蕨类全基因组测序的候选种(图3)[8]。该研究为更好地了解蕨类基因组特征,同时解决长期存在的蕨类多倍性和染色体进化问题,提供了路线图。
图3 蕨类全基因组测序候选种的系统发育位置及其基因组大小[8]
蕨类测序策略:ONT超长+Bionano Gen2+Hi-C+NextDenovo
二代测序见证了过去10年的“基因组大爆发”,超过数百个种子植物基因组被测序发表,但是面对基因组情况复杂的蕨类,二代测序技术捉襟见肘。长读长的三代测序、光学图谱、色体构象捕获等新技术,是目前解决复杂动植物基因组De novo组装的有效策略。
表1 蕨类基因组De novo测序策略
希望组科技服务作为三代测序服务的领跑者,在复杂、大型动植物基因组组装方面有着独特优势。
平台优势——ProthemION48、Saphyr Gen2
牛津纳米孔ProthemION48能够提供平均5Tb/周的高质量长读长测序数据,Bionano Saphyr升级至Gen2平台,数据产出提升4倍,完美适配超大型基因组测序项目。

· 测序优势——ONT ultra-long reads 超长测序技术
 
牛津纳米孔测序测序平台独有的Ultra-long测序能够产生超长测序片段,轻松跨越基因组中连续重复或大片段重复区域,显著提升组装质量,更大限度地还原真实的基因组景观。希望组自2017年推出ONT超长测序服务以来,现已完成昆虫、两栖动物、鱼类、鸟类、哺乳动物、多倍体植物、药用植物等数百个物种的ONT Ultra-long测序工作,并且多个物种测序单Cell read N50突破100Kb!

· 算法优势——NextDenovo
希望组自主研发三代测序数据高效纠错、组装软件NextDenovo,在极大减少计算资源和运行时间的情况下,仍然能够组装出高质量基因组。基于NextDenovo,希望组已经实现了小基因组物种近完成图和>10Gb基因组物种的组装工作。

表2 NextDenovo的组装案例

· 辅助组装——Bionano&Hi-C
希望组同时提供Bionano光学图谱和Hi-C测序服务,在三代测序数据组装基因组的基础上结合不同分辨率的辅助组装策略,打造染色体级别的基因组。
通过以上分析可以发现蕨类基因组动力学与所有其他陆地植物截然不同,对研究植物多倍性和染色体进化有重要的研究价值。在一代测序和二代测序时代,受限于测序技术自身局限性以及测序成本的高昂,很难针对基因组普遍较大的蕨类进行测序,随着长读长三代测序技术的崛起以及测序通量的提升,已经有研究人员开始筹划针对蕨类的大规模基因组测序计划,并整理出了了18个跨越蕨类进化树的中型基因组,作为未来蕨类全基因组测序的候选种。因此,蕨类基因组研究无疑是一片有待深入探究的蓝海,希望组作为三代测序服务的领跑者愿成为您科研航程的领航员!