10万个细菌完成图计划 | 希望组携三代测序技术亮相第三届人体微生物组创新未来者大会

2018年7月28日,微生物组领域备受瞩目的第三届人体微生物组创新未来者大会在上海小南国花园酒店隆重举行。本次大会由同济大学附属第十人民医院主办,锐翌生物科技承办,大会吸引了国内外微生物组领域四百多位参会代表,包括有三十多位Speaker、七十多位企业代表,以及众多对本领域感兴趣的青年学者及投资人。大会聚焦微生物组与人体健康、微生物组与肿瘤免疫治疗、菌群移植研究、微生物组产业研讨等议题,共同讨论中国微生物组产业的发展前景。

同济大学附属第十人民医院秦环龙院长发表了大会开幕致辞。随后,同济大学医学院党委书记张军教授对来自国内外的嘉宾表示了热烈的欢迎并宣布大会正式开始。

7月29日下午,希望组CEO汪德鹏先生和微生物线研发总监樊俊鹏博士做了题为“三代测序在微生物组研究中的机遇与挑战”的演讲,通过对比二代测序(NGS)和三代测序(TGS)特点,向与会专家学者介绍了TGS的测序原理和优势,并重磅推出“10万个细菌完成图计划”,旨在加速建立微生物参考基因组数据库,从而推动微生物组的研究。

汪总提到:目前大部分高通量测序还是二代测序,但是NGS还不够完美,测序数据读长短,测序过程需要扩增导致其测序数据具有碱基偏好性,因此肠道菌群宏基因组拼接的时候是碎片化的、不完整的,无法得到准确的单体型、完整的质粒,也无法完全区别菌株内部的差异性。三代测序以PacBio和ONT为代表,最大优点是超长的读长,可以轻松跨越基因组的重复序列区域,再加上其单分子测序,基本没有覆盖度偏向性(Bias),从而可以完美地用于微生物宏基因组检测。希望组这几年一直在研究基于三代测序的微生物宏基因组研究,随着测序技术和试剂的不断升级,读长的逐渐增加,三代测序技术进行宏基因组研究将会有新的突破。为此,希望组重磅推出“10万个细菌完成图计划”,旨在加速建立微生物参考基因组数据库,让1%以上丰度的细菌组装成完成图,推动微生物组的研究,从而在微生物组领域、在全世界掀起了一个新的浪潮。

樊俊鹏博士结合2个实际测序案例,证明了三代测序可以组装出更连续、更准确的宏基因组。第一个例子介绍了2016年发表在mBio上的一篇人皮肤宏基因组的文章,作者利用二代和三代测序技术对样品中的模仿棒状杆菌组装结果进行比较,发现二代组装出171条contig,连续性比较差,完整度98.5%,三代组装出6条contig,这6条contig能进一步连接成环状基因组,完整度100%,这表明三代测序能获得比二代测序更好的组装结果。第二个例子是希望组团队与锐翌基因团队近期合作的检测一个健康人的肠道宏基因组,通过NGS和TGS数据的比对,发现仅68% TGS数据就覆盖了90% NGS数据,说明TGS数据获得了更多的样本基因组信息。进一步对NGS和TGS的数据分别进行宏基因组初步组装,通过对比一个宿主为肠沙门氏菌的噬菌体基因组(PhageX),发现TGS组装得到的PhageX的基因组比NGS的更加准确,从而进一步证明了TGS可以组装出更连续、更准确的宏基因组。继续通过统计Phage X和肠沙门氏菌的比例,可以看到PhageX的丰度是肠沙门氏菌的100倍左右,推断PhageX刚刚帮助人体抵御了一次肠沙门氏菌的感染。

TGS用于宏基因组测序具有很大的优势,对数据进行更深一步挖掘还可以获得更多的基因组信息和表观遗传组信息。此外,TGS测序数据也存在注释率过低的情况,大约只有45%的CCS能够注释到种水平,这表明环境中存在着大量的未知物种。如果想要提高物种注释率,我们需要更加完整的人体微生物基因组数据库。

正是基于此,希望组推出了“10万个细菌完成图计划”,该计划将采用最新的ONT PromethION平台对单菌完成图进行检测,产量为50G/Cell,1天可达到1T的数据量,价格低至3000元一个细菌完成图!!!我们期望更多的老师和同行加入到该计划中,一起加速完善微生物参考基因组数据库,从而推动微生物组的研究。

重大突破| 三代测序助力人类基因组DNA 6mA甲基化研究

近日,中山大学中山眼科中心肖传乐教授、广州医科大学附属第三医院晏光荣教授、中国农业科学院生物技术研究所谷晓峰研究员、北京放射医学研究所伯晓晨研究员、美国费城儿童医院&北京希望组首席科学家王凯教授等学者与北京希望组余国亮带领的团队共同合作完成的文章“N6-Methyladenine DNA Modification in Human Genome”在 Molecular Cell杂志在线发表。该研究利用三代测序技术,首次获得了中国人DNA  N6-甲基腺嘌呤(6mA)修饰图谱,是人类基因组DNA甲基化研究领域的重大突破。

DNA甲基化是表观遗传调控的重要组成部分,在调控基因组印记、X染色体失活、转座子沉默、基因表达、表观遗传记忆、胚胎发育和肿瘤发生等方面发挥着重要作用。真核生物中,5mC是最常见的甲基化修饰,而在原核生物中,6mA是最常见的甲基化修饰,且6mA甲基化在限制-修饰(R-M)系统的调控、DNA错配修复、基因表达等方面发挥了重要的作用。在早期的研究中,受技术条件的限制,并没有在真核生物中检测到DNA 6mA修饰,因此过去认为DNA 6mA在包括人类在内的真核生物中不存在。近年来,随着测序技术的不断发展,已经在莱茵衣藻、秀丽隐杆线虫、 果蝇 、真菌等真核生物中发现了DNA 6mA的存在,并且发现6mA甲基化参与了调控基因和转座子的表达。此外,已有大量研究表明RNA m6A修饰在人类mRNA中广泛存在,与RNA剪接、mRNA稳定性和基因表达有关。但有关DNA 6mA修饰是否广泛存在于人类基因组中,以及是否在基因调控和疾病致病机制中发挥作用等问题仍未得到深入研究。

近年来以PacBio SMRT和Oxford Nanopore 为代表的三代测序技术将高通量和长读长相结合,同时具有高效、单碱基分辨率的优势,无需额外的样本制备,可直接获得整个基因组范围内的区域甲基化信息,为评估人类基因组中的甲基化提供了一个有效的方案。

本研究首先对第一个基于三代测序的亚洲人参考基因组“华夏一号”的PacBio SMRT测序数据进行分析,共发现881,240个 6mA 修饰位点,首次获得了中国人DNA  N6-甲基腺嘌呤(6mA)修饰图谱。通过分析该甲基化图谱的特征,发现DNA 6mA在常染色体上的丰度较高,在X染色体和Y染色体中的丰度相对较低,且这些位点主要富集在外显子编码区。

各染色体上DNA 6mA的丰度分布

DNA 6mA在染色体各区域上的丰度分布

RNA 6mA已被证实对基因表达有重要的影响,但DNA 6mA在基因表达方面的潜在作用在很大程度上仍不清楚。本研究发现,高表达水平基因的外显子区域具有较高的6mA丰度,且进一步分析发现外显子区域的6mA丰度与RNA表达水平正相关。此外,通过对DNA 6mA丰度高的基因进行了GO富集分析发现,6mA修饰位点在G 蛋白偶联受体(GPCR)相关基因中有显著的富集。GPCRs作为膜蛋白受体参与多个细胞信号转导过程,以改变细胞的状态,且与许多疾病的发生有关,也是约40%治疗性药物的通用靶点。因此,6mA甲基化可能在GPCR相关基因表达调控中发挥重要作用,但还需进一步的研究。

m6A丰度与RNA表达水平的关系及其位置分布

此外,本研究发现和证实了DNA 6mA由N6AMT1甲基化转移酶和ALKBH1去甲基化酶调控。为了研究DNA 6mA的功能,该研究还分析了肿瘤组织及非肿瘤组织的6mA水平。结果发现,与非肿瘤组织相比,肿瘤组织中6mA及其甲基转移酶N6AMT1的水平呈现下调,而去甲基化酶ALKBH1的水平呈现上调。为了进一步研究DNA 6mA修饰对肿瘤发生的影响,对癌细胞中N6AMT1和ALKBH1进行过表达和沉默。结果发现沉默N6AMT1基因降低了癌细胞基因组的DNA 6mA水平,促进了癌细胞的生长,而N6AMT1过表达则以剂量依赖性方式抑制了癌细胞生长。沉默ALKBH1基因则增加了癌细胞基因组DNA 6mA水平,抑制了癌细胞的生长,而ALKBH1过表达以剂量依赖的方式逆转了这些效应。此外,通过构建肺癌异种移植小鼠模型,也得到与上述一致的结论。因此,结果表明DNA 6mA修饰水平的降低可以促进肿瘤发生。

N6AMT1下调对细胞增殖,迁移能力和肿瘤大小的影响

ALKBH1下调对细胞增殖,迁移能力和肿瘤大小的影响

综上所述,本研究首次获得了中国人DNA  N6-甲基腺嘌呤(6mA)修饰图谱,揭示了DNA 6mA甲基化修饰在人类基因组中的调控机制,加深了人们对于DNA 6mA甲基化生物学功能的认识。

热议基因组|“垃圾”DNA究竟是垃圾还是宝藏

自DNA被发现以来就一直被誉为“生命天书”,对这本无字天书的完全解读也成为了无数科学家毕生追求的梦想。但随着人们对书中内容不断探索,却意外发现那些影响我们高矮胖瘦、生老病死等关键信息的基因只占基因组DNA的极少部分,而绝大部分看似不会编码蛋白质的DNA,有的人形容它们为“垃圾”DNA。但这个充满功利性的命名也就此引起了一场愈演愈烈的讨论。最近在《Cell》上发表的一篇重磅文章[1],不仅将“‘垃圾’DNA究竟是基因组垃圾堆还是珍贵的宝藏”这个议题拉回大众视野,而且也隐隐预示着一场盛大的“淘金运动”正悄然进行。

“垃圾”DNA的前世今生

19世纪60年代,孟德尔(Gregor Mendel)通过实验预示了基因的存在。随后分别于1869年和1944年,DNA被首次提取和证明为构成基因的基础物质。DNA即脱氧核糖核酸,而基因则是具有遗传效应的特定DNA序列,通俗地讲,基因就是一段编码某种蛋白质的DNA。

到了20世纪60年代后期,越来越多人发现,真核生物的DNA包含了数量庞大的重复DNA,而且这些DNA似乎并不会编码蛋白质。1972年,大野乾(Susumu Ohno)正式将基因组中的非编码DNA命名为“垃圾”DNA。这个充满负面情感的名字也充分体现了当时科学家对于这些非编码DNA的看法,人们甚至认为这些序列没有积极功能,只是一些自私的DNA序列并热衷于自我扩张,这一理念也在1989年随着道金斯(Richard Dawkins)成名作《自私的基因》的大卖而广为人知。

众人皆醉我独醒,在大部分人都将“垃圾”DNA弃如敝履的时候,那些独具慧眼的人总能从“垃圾堆”中发现何氏之璧,隋侯之珠。经过这些科学家孜孜不倦地探索,从20世纪90年代初开始,人们对于“垃圾”DNA的看法才慢慢有了转变。在完成了“人类基因组计划(HGP)”的草图之后,科学家发现人类基因只有2-3万个左右,占基因组总长度仅约1%,而剩余的99%均为非编码DNA,也就是人们通常所说的“垃圾”DNA。这99%的“垃圾”DNA犹如斯芬克斯之谜一样一直困扰着人们。直到2012年,一项名为“DNA元件百科全书(Encyclopedia of DNA Elements,ENCODE)”的项目[2]接连用多篇科学论文向人们宣布,在人类基因组中超过80%的DNA都是有功能的!从此,人们更加相信“垃圾都是放错地方的资源”,只是我们没有全面了解“垃圾”DNA起作用的真正方式,并纷纷开始尝试挖掘“垃圾堆”中被掩藏的瑰宝。

“垃圾”DNA——有待发掘的宝藏

所谓的“垃圾”DNA其实是个相当笼统的称呼,它的真实内涵十分丰富,包括了非编码的功能RNA、顺式/反式调控元件、内含子、假基因、端粒、中心粒以及含量最多的转座子和串联重复序列等。随着人们逐步深入地探索,也发现了它们各不相同的真实功能。

目前关于“垃圾”DNA的研究,主要分成两大方向,一个方向主要是关注“垃圾”DNA的各种特殊功能及其对生理进程的影响。

“垃圾”DNA中可能潜藏癌症病原[3]
随着测序成本直线下降,极大地促进了个人基因组测序的发展。要从海量DNA变异数据中筛选出有用信息是一项意义重大的挑战,尤其是在癌症基因组中,许多的关键DNA变异体更是处在非编码的“垃圾”DNA区域。研究人员通过结合“千人基因组项目(the 1000 Genomes Project)”和ENCODE的数据,开发出一套分析流程,并成功鉴定了那些隐藏在“垃圾”DNA中可能导致癌症发生的DNA变异体。

“垃圾”DNA还能决定你的盛世美颜[4]
人脸的外形是人类最显著的特征之一,面部形态的差异在社会互动、心理学、法医和临床遗传学等领域都有着重要的意义。颅面部形状是高度遗传的,包括形态变异的正常谱以及主要颅面部出生缺陷的易感性。有研究者利用染色质免疫共沉淀技术及测序技术对小鼠胚胎面部组织的发育过程进行研究,探讨了转录增强子在颅面部复合体发育中的作用。这种增强子可以在距离其靶基因数百Kb的地方,远距离调控靶基因表达的空间模式、水平和时间。

Fig.1 颅面发育增强子对颅面形态有一定的作用

“垃圾”DNA通过编码lncRNA参与调控抑制致癌基因[5]
“垃圾”DNA编码产生的长非编码RNA(IncRNAs)具有调节基因表达的作用。研究者使用多个小干扰RNA(siRNAs)来沉默GNG12-AS1基因表达。研究发现,当大多数siRNAs沉默GNG12-AS1转录后,siRNA互补于GNG12-AS1的第一个外显子抑制其转录。在转录过程中,GNG12-AS1的沉默会引起DIAS3(抑瘤因子)的上调,证明其在转录干扰中的作用。

Fig.2 siRNA抑制转录干扰

“垃圾”DNA成员LTR被异常激活会触发原癌基因[6]
哺乳动物基因组中包含大量重复序列,其中长末端重复(long terminal repeats,LTRs)一直以来都被认为可能与肿瘤发生有关。这篇文章表明LTRs的脱抑制化作用与人类淋巴瘤的发病机制有关,这一发现具有十分重要的诊断、预警和治疗意义。

“垃圾”DNA编码的microRNA能促进胚胎发育[7]
严格控制内胚层、中胚层和外胚层的分离对于所有物种的正常胚胎发育都至关重要。研究者通过对全基因组microRNA文库进行系统性扫描,发现其中两个microRNA家族会以牺牲内胚层为代价促进中胚层的生长,这意味着“垃圾”DNA编码的microRNA在胚层规划中具有十分关键的作用。
“垃圾”DNA是一种精心设计的基因表达控制机制[8]
人们普遍认为内含子保留(Intron Retention,IR)是由于信使RNA前体错误剪切内含子序列导致的。研究者通过对转录组和蛋白质组的数据进行生物信息学分析,发现在正常血液白细胞分化的过程中,内含子保留其实是一种通过触发无义介导的衰变途径(nonsense-mediated decay,NMD pathway)进行基因表达控制的生理机制。

“垃圾”DNA可能改变基因的剪切方式[9]
为了更深入了解基因的剪切调控机制,研究者通过一种基于细胞的筛选方法,从内含子中鉴定了10个能抑制剪切的不同模体结构。所有模体结构都表现出了外显子剪切增强或沉默的活性,依据它们的分布进一步将其进行分组分析,最后发现分组产生的集群具有明显的内容依赖(context-dependent)作用模式。

“垃圾”DNA影响表观遗传的稳定性
这篇文章深入阐释了人类基因组中的“垃圾”DNA之一,HSATII(high-copy satellite II)可以结合并影响核染色质调控蛋白的分布,这往往导致癌症的发生[10]。另外,DNA甲基化精密地调控基因组织特异性表达及关键的生物进程。然而,缺乏可靠手段检测基因组中庞大的DNA甲基化信息成为系统分析其功能的一大阻碍。另一篇文章的研究者通过利用一个深度学习模型网络研究DNA甲基化的调控编码规则,并利用此网络预测序列变异对CpG附近位置DNA甲基化的影响[11]。由此可见,另一个方向的主要关注点则是如何快速高效获取“垃圾”DNA序列信息,编码规则和预测模式等结构意义上的研究。

“垃圾”DNA可能形成具有转录活性的功能基因
研究者通过“蛋白-转录组”方法(proteo-transcriptomics approach)结合RNA测序及蛋白组学数据,证明大量的Alu外显子具有转录活性,且能产生灵长目特异,甚至人类特异的亚型蛋白,揭示了“垃圾”DNA参与基因异构体(isoforms)形成的潜在机制[12]。另一篇综述文章则着重讨论了近几年关于新出现基因的鉴定和验证等问题,并预测该领域将来的研究方向可能集中在新蛋白编码基因的功能、结构解析以及其出现机制等[13]

Fig.3 蛋白质组学Ribo-seq数据证明Alu-外显子能够编码蛋白质

10 高速发展的测序技术结合多种研究方法助推“垃圾”DNA的深入探索
研究者提出,结合基因组和转录组数据能有效促进孟德尔疾病遗传机理的研究。另外,许多研究已表明,“垃圾”DNA会参与转录剪切和调控进程,因此作者也提醒,在分析相关内容时,一定要注意研究对象的生长时期,以及微小的调控效应,这些因素可能会对研究结果产生明显的影响[14]。正如本文最开始提及的那篇重磅《Cell》文章所描述的,“垃圾”DNA代表之一的LINE1基因会在小鼠胚胎早期发育过程中的胚胎干细胞有高表达,这一特殊时期的奇异现象引起了研究者的重视,才诞生了这篇意义重大的文章,同时也为“垃圾”DNA的正名提供了强有力的证据。“垃圾”DNA不仅不是垃圾,相反它是生命体不可或缺的重要部分,假如没有LINE1序列,受精卵将永远停留在两细胞的状态,无法完成复杂的生长分化过程[1]另一篇文章利用第二代测序技术鉴定了与神经系统疾病相关的“垃圾”DNA变异体。了解神经发育和神经精神障碍的遗传因素是医学研究的一个主要的挑战[15]。虽然大规模的基因组测序在这一领域取得了重大进展,但对许多疾病来说,其遗传基础仍是十分复杂且知之甚少的秘密,特别是对于占基因组绝大部分的“垃圾”DNA区域,其结构复杂、重复率高等特点都严重阻碍了二代测序对该区域DNA有效信息的获取和利用。随着第三代测序的不断发展,测序通量不断提高,测序错误率不断下降,拥有超长读长、有效覆盖重复序列、无GC偏好性且能直接检测DNA甲基化等诸多优点的第三代测序技术简直就是解决这一难题的完美工具,相信已经有许多研究者正着手利用这些新兴技术攻克围绕“垃圾”DNA的各种难关。如果说第一代测序和第二代测序催生了以“人类基因组计划”为代表的基因挖掘运动,那么第三代测序所推动的将是一场涉及多技术共同协作,规模空前盛大的“淘金运动”。希望组拥有PacBio SMRT、Oxford Nanopore、BioNano光学图谱等技术平台,并于2016年完成了首个基于三代测序的亚洲人基因组“华夏一号”,拥有丰富的三代测序项目经验,三代研究文章已有多篇发表于国际知名期刊。目前,希望组已重磅推出“华夏万人SV”,旨在构建中国健康人群高分辨基因组结构变异图谱、单碱基精确度的DNA甲基化图谱,弥补目前基因组数据库的空白,进而通过对大规模的疾病群体进行基因组结构变异分析,明确广泛的疾病和病症相关的罕见遗传变异,这将对中国人群基因组学研究、遗传性疾病研究、精准医疗应用等领域产生重要的科学及临床价值。

参考文献

[1] Percharde M, Lin C J, Yin Y, et al. ALINE1-Nucleolin Partnership Regulates Early Development and ESC Identity[J].Cell, 2018.

[2] https://www.encodeproject.org/

[3] Khurana E, Fu Y, Colonna V, et al.Integrative annotation of variants from 1092 humans: application to cancergenomics[J]. Science, 2013, 342(6154): 1235587.

[4] Attanasio C, Nord A S, Zhu Y, et al. Finetuning of craniofacial morphology by distant-acting enhancers[J]. Science,2013, 342(6157): 1241006.

[5] Stojic L, Niemczyk M, Orjalo A, et al.Transcriptional silencing of long noncoding RNA GNG12-AS1 uncouples its transcriptionaland product-related functions[J]. Nature communications, 2016, 7: 10406.

[6] Lamprecht B, Walter K, Kreher S, et al.Derepression of an endogenous long terminal repeat activates the CSF1Rproto-oncogene in human lymphoma[J]. Nature medicine, 2010, 16(5): 571.

[7] Colas A R, McKeithan W L, Cunningham T J,et al. Whole-genome microRNA screening identifies let-7 and mir-18 asregulators of germ layer formation during early embryogenesis[J]. Genes &development, 2012.

[8] Wong J J L, Ritchie W, Ebner O A, et al.Orchestrated intron retention regulates normal granulocyte differentiation[J].Cell, 2013, 154(3): 583-595.

[9] Wang Y, Xiao X, Zhang J, et al. A complexnetwork of factors with overlapping affinities represses splicing throughintronic elements[J]. Nature structural & molecular biology, 2013, 20(1):36.

[10] Lin L, Jiang P, Park J W, et al. Thecontribution of Alu exons to the human proteome[J]. Genome biology, 2016,17(1): 15.

[11] Schmitz J F, Bornberg-Bauer E. Fact or fiction:updates on how protein-coding genes might emerge de novo from previouslynon-coding DNA[J]. F1000Research, 2017, 6.

[12] Zeng H, Gifford D K. Predicting the impactof non-coding variants on DNA methylation[J]. Nucleic acids research, 2017,45(11): e99-e99.

[13] Hall L L, Byron M, Carone D M, et al.Demethylated HSATII DNA and HSATII RNA foci sequester PRC1 and MeCP2 intocancer-specific nuclear bodies[J]. Cell reports, 2017, 18(12): 2943-2956.

[14] Valente E M, Bhatia K P.Solving Mendelian Mysteries: The Non-coding Genome May Hold the Key[J]. Cell,2018, 172(5):889.

[15] Devanna P, Chen X S, Ho J, et al. Next-gensequencing identifies non-coding variation disrupting miRNA-binding sites inneurological disorders[J]. Mol Psychiatry, 2018, 23(5):1375-1384.

部分图片来源于网络,侵删

聚焦行业创新技术 | 希望组携三代测序技术受邀参加第四届精准医疗与基因测序大会

2018年6月30日,以“交叉融合,协同创新”为主题的第四届精准医疗与基因测序大会在北京协和学术会堂隆重召开。本届大会由测序中国、北京协和医院肝外科共同主办,中国医学科学院基础医学研究所、919肿瘤精准免疫公益专项基金、欧美同学会医师协会青委会协办,吸引了近千人参加并得到了几十余家企业和媒体的参与和支持。

大会主席中国工程院院士、生物芯片北京国家工程研究中心主任程京做开幕致辞。随后,中国工程院院士、北京大学医学部主任詹启敏教授,北京大学肿瘤医院院长季加孚教授等50余位国内外专家学者就精准医学国际前沿、精准医学的临床研究与应用等方面分别做了精彩报告。

6月30日下午,在主会场的热烈氛围下,分会场二:创新·前沿“NGS创新技术论坛”也拉开帷幕,希望组CEO汪德鹏先生作为优质基因企业代表、产业界权威专家受邀出席了本次论坛,并做了题为“Nanopore Sequencing for Genomic Disorders”的演讲,讲述了希望组三代测序应用公司的发展历程、Oxford Nanopore 测序技术的特点及其在“基因组学病”检测中的优势。

汪德鹏先生介绍到,三代测序的最大优点是超长的读长,可以轻松跨越基因组的重复序列区域,再加上其单分子测序,基本没有覆盖度偏向性(Bias),从而可以完美地用于全基因组结构变异(SVs)检测。例如,希望组基于三代测序技术对一例疑似患有糖原累积病Ia型(GSD-Ia)而且全外显子组检测阴性的患者精准鉴定出基因组结构变异,不仅对患者进行了确诊,同时还明确了结构变异的来源,从而为胚胎植入前遗传学诊断提供了重要参考。相关的文章已经在线预发表,点击了解更多信息:重大成果 | Nanopore测序精准鉴定基因组结构变异,让全外显子组检测阴性案例得到确诊,为PGD提供重要参考

随后,汪总详细介绍了希望组已重磅推出的“华夏万人SV”,并指出该项目是继“华夏一号”和“中华家系一号”后的又一重大计划,旨在构建中国健康人群高分辨基因组结构变异图谱、单碱基精确度的DNA甲基化图谱,弥补目前基因组数据库的空白,进而通过对大规模的疾病群体进行基因组结构变异分析,明确广泛的疾病和病症相关的罕见遗传变异。这将对中国人群基因组学研究、遗传性疾病研究、精准医疗应用等领域产生重要的科学及临床价值。

同时,汪总还分享了以三代测序和光学图谱为主要亮点的“个人参考基因组服务计划”。该计划采用最新的ONT GridION/PromethION、Bionano Saphyr、Illumina、10X Genomics测序以及高分辨率的生物芯片平台,对每一个样本采用多种平台进行检测,通过基因组组装,并进行Phasing,得到一个二倍体(Diploid)的个人参考基因组,最后对SNP/InDel/SV/STR/Methylation五种变异同时进行检测,从而在全球范围率先重新定义“全基因组测序(WGS)”的技术标准,宣告了“个人参考基因组”时代的到来。

这个6月不止有世界杯,还有6.28国际癫痫关爱日

在2006年10月第二届北京国际癫痫论坛上,中国抗癫痫协会发起创办“国际癫痫关爱日”的倡议,并得到国际抗癫痫联盟、国际癫痫病友会、世界卫生组织以及多个国家和地区的支持。与会者选定以1997年在爱尔兰都柏林举行的国际癫痫大会通过“全球抗癫痫运动”的日子,即6月28日为“国际癫痫关爱日”,旨在全球改善对癫痫的认识、治疗、服务与预防。

 

今年是第十二个“国际癫痫关爱日”,主题是“癫痫与脑科学——癫痫打开探索人脑秘密的大门”,宣传癫痫在脑科学研究中的地位和重要性,呼吁政府相关部门、科研机构及广大民众,认识癫痫疾病、重视癫痫研究。

癫痫(Epilepsy)是仅次于脑卒中的常见慢性神经系统疾病,以脑神经元过度放电导致反复性、发作性和短暂性的中枢神经系统功能失常为特征。癫痫可以发生于任何年龄,但是小孩和老人的发病率更高。

遗传因素是导致癫痫、尤其是经典的特发性癫痫的重要原因。据报道,超过50%的癫痫患者是由于基因突变导致,其中约1—2%的患者是单个基因突变造成,还有大部分患者是由于多基因和环境因素的相互作用。

随着高通量测序技术的发展及应用,越来越多的癫痫的致病基因被发现,基因检测技术尤其是全外显子组测序已成为重要的临床检测手段,不仅可以从分子水平上明确病因,早发现、早干预,更可以指导科学婚育、促进药物与治疗方法的开发,具有重要的科学价值与临床意义。

但基于二代测序技术的全外显子组检测由于读长短、对基因组覆盖不均匀等局限,主要对SNVs和InDels进行检测,对重复序列、结构变异等复杂区域的检测通常无能为力。有文献报道,良性成人家族性肌阵挛性癫痫(benign adult familial myoclonic epilepsy,BAFME)[1]、有听觉症状的常染色体显性遗传癫痫(Autosomal dominant epilepsy with auditory features,ADEAF)[2]等疾病是由结构变异如倒位、易位、重排、拷贝数变异等导致的,因此二代等测序技术可能会导致癫痫致病变异的漏检或错检。

长读长测序技术,也被称为第三代测序技术,凭借长读长、无PCR过程、可轻松跨越基因组重复区域、高GG区域等优势,弥补了传统测序技术对结构变异的漏检,为揭秘更多的癫痫疾病提供了更有力的支持,为更多的患者带来了新的希望。Nature Genetics杂志发表一篇文章[1],采用了Oxford Nanopore和PacBio SMRT测序技术对良性成人家族性肌阵挛性癫痫(BAFME)患者进行检测,结果发现,基因非编码区的TTTCA和TTTTA的异常扩张是导致BAFME的致病原因。

我们相信,随着国家脑科学研究的深入,癫痫学科发展将更加迅速,今天难治性癫痫,明天就可能被攻克,脑科学研究进展,必将为癫痫患者带来崭新的希望和光明的前景。

目前,希望组已重磅推出“华夏万人SV”,旨在构建中国健康人群高分辨基因组结构变异图谱、单碱基精确度的DNA甲基化图谱,弥补目前基因组数据库的空白,进而通过对大规模的疾病群体进行基因组结构变异分析,明确广泛的疾病和病症相关的罕见遗传变异,这将对中国人群基因组学研究、遗传性疾病研究、精准医疗应用等领域产生重要的科学及临床价值。

参考资料

[1] Ishiura H et.al. Expansions of intronic TTTCA and TTTTA repeats in benign adult familial myoclonic epilepsy. Nat Genet. 2018 Apr;50(4):581-590.

[2] Leonardi E et.al. CNTNAP2 mutations and autosomal dominant epilepsy with auditory features. Epilepsy Res. 2018 Jan;139:51-53.

全国爱眼日 | 以基因检测之力,守护您的“睛”彩

你是我的眼

带我领略四季的变换

你是我的眼

带我穿越拥挤的人潮

你是我的眼

带我阅读浩瀚的书海

因为你是我的眼

让我看见这世界

就在我眼前

······

如果光明就是希望

那么眼睛就是我们

通往光明、看见希望的最好伙伴

今天是第23个全国爱眼日

让我们一起来了解一下“眼科遗传性疾病”

做到早发现、早预防、早治疗!

敲黑板,划重点
眼科遗传性疾病是一大类由遗传基因缺陷导致的视觉疾病,是临床上常见且危害严重的遗传性致盲疾病。目前已知的遗传性眼科疾病有600种以上,如先天性近视、先天性白内障、色盲、黄斑变性、Leber先天性黑朦、视网膜色素变性等。据世界卫生组织 (WHO) 发布的数据显示,白内障、青光眼、黄斑变性、角膜病、儿童眼病等是致盲的主要原因[1],其中约一半的儿童期致盲与遗传因素相关[2]。单基因遗传性眼病患者约占总人口4%,多基因眼病则更多见。

2010年全球致盲因素统计分析

眼科遗传性疾病包含的疾病种类繁多,具有高度的临床异质性和遗传异质性。某些疾病表型非常相似,难以鉴别诊断。此外,同一疾病可见于不同年龄段且临床表现可能不同,仅依据发病的临床特征进行诊断容易误诊或漏诊

随着高通量测序技术的发展及应用,越来越多的眼科遗传性疾病的致病基因被发现,基因检测技术尤其是全外显子组测序已成为重要的临床检测手段,不仅可以从分子水平上明确病因,早发现、早干预,更可以指导科学婚育、促进药物与治疗方法的开发,具有重要的科学价值与临床意义。

但是全外显子组测序等二代测序技术由于读长短、对基因组覆盖不均匀等局限,主要对SNVs和InDels进行检测,对重复序列、结构变异等复杂区域的检测通常无能为力。有文献报道,年龄相关性黄斑变性[3]、视网膜色素变性[4]等眼科遗传性疾病是结构变异如倒位、易位、重排、拷贝数变异等导致的,因此二代等测序技术会导致眼科遗传性疾病致病变异的漏检或错检。

长读长测序技术,也被称为第三代测序技术,凭借长读长、无PCR过程、可轻松跨越基因组重复区域、高GG区域等优势,弥补了传统测序技术对结构变异的漏检,为揭秘更多的眼科遗传性疾病提供了更有力的支持,为更多的患者带来了新的希望。

目前,希望组已重磅推出“华夏万人SV”,旨在构建中国健康人群高分辨基因组结构变异图谱、单碱基精确度的DNA甲基化图谱,弥补目前基因组数据库的空白,进而通过对大规模的疾病群体进行基因组结构变异分析,明确广泛的疾病和病症相关的罕见遗传变异,这将对中国人群基因组学研究、遗传性疾病研究、精准医疗应用等领域产生重要的科学及临床价值。

参考资料

[1] WHO. Global Data on Visual Impairments 2010(WHO/NMH/PBD/12.01).

[2] Br J Ophthalmol 1999;83:929–932.

[3] Cantsilieris S, et al. Recurrent structural variation, clustered sitesof selection, and disease risk for the complement factor H (CFH) gene family.Proc Natl Acad Sci U S A. 2018 May 8;115(19):E4433-E4442.

[4] Geoffroy V, et al. Whole-genome sequencing in patients withciliopathies uncovers a novel recurrent tandem duplication in IFT140. HumMutat. 2018 Apr 24.

自闭症可遗传自父亲基因组非编码区的结构变异

自闭症是一类复杂的疾病,并非由单一的基因突变导致。在过去的十年中,科学家们已经发现了数百种可能增加自闭症患病风险的编码区的基因突变。而最近由加州大学圣地亚哥分校(UCSD)的研究人员发表在《Science》杂志上的 一篇题为“Paternally inherited cis-regulatory structural variants are associated with autism”的研究,发现非编码区的突变也可能导致自闭症。

阅读更多

Nanopore测序技术引全球关注 | 希望组&未来组首席科学家王凯教授闪耀London Calling 2018

5月24日-25日,由 Oxford Nanopore Technologies主办的London Calling 2018年度盛会在坐落于英国伦敦泰晤士河旁的金融城中心盛大召开。来自海内外的600多名参会者和80位演讲者共同分享了纳米孔测序技术在微生物学、癌症研究、人类遗传学以及医疗/诊断学等领域的应用。希望组&未来组首席科学家王凯教授受邀参加了本次盛会,并分享了题为《Detecting DNA modifications and structural variants from nanopore long-read sequencing data》的精彩报告,引起了与会者的热烈讨论与好评。

本次大会主要围绕MinION、GridION以及PromethION技术的优势和应用展开。王凯教授在报告中详细介绍了纳米孔长读长相对于短读长测序在直接检测DNA修饰以及结构变异表征等方面的优势,并为大家展示了一种创新性的分析工具——NanoMod。DNA碱基修饰在DNA复制起始、错配修复、细菌中寄主控制的修饰与限制以及转座子的失活等过程中对维持遗传信息的稳定性发挥着重要的作用。从Nanopore数据中识别碱基修饰,难度比较大,对算法拟合的精确度要求较高。王凯教授课题组开发的NanoMod,可以通过分析原始信号中的强度特征,改善DNA修饰检测的分析,从而极大的提高碱基修饰信息识别的准确度。关于NanoMod的测评分析文章[1]已经在线预发表,点击了解更多信息:NanoMod 发布,适配于纳米孔测序数据的碱基修饰检测工具

此外,王凯教授进一步讨论了纳米孔全基因组测序在临床方面的应用。他分享了采用低深度(12x)GridION全基因组测序,在一例疑似患有糖原累积病Ia型(GSD-Ia)而且全外显子组检测(Whole Exome Sequencing,WES)阴性的患者中精准鉴定出基因组结构变异(Structural Variations,SVs),不仅对患者进行了确诊,同时还明确了结构变异的来源,从而为胚胎植入前遗传学诊断(Preimplantation Genetic Diagnosis,PGD)提供了重要参考,帮助该患者的父母成功生育了另一个健康宝宝。相关的文章[2]已经在线预发表,点击了解更多信息:重大成果 | Nanopore测序精准鉴定基因组结构变异,让全外显子组检测阴性案例得到确诊,为PGD提供重要参考

这场为期两天的盛会是一场长读长测序的盛宴,希望组&未来组也得到了与会学者的高度关注和赞扬,许多专家学者表示愿意与我们携手一起探索长读长测序技术的奥妙,共同推动测序技术的发展,用新技术让疾病的检测更简单、更精准!

参考文献

[1] Liu Q, Georgieva D C,Egli D, et al. NanoMod: acomputational tool to detect DNA modifications usingNanopore long-read sequencing data.bioRxiv preprint first posted online Mar. 5,2018. doi: http://dx.doi.org/10.1101/277178.

[2] Hefan Miao, JiapengZhou, Qi Yang, et al. Long-read sequencing identified a causal structuralvariant in an exome-negative case and enabled preimplantation geneticdiagnosis. bioRxiv preprint first posted online May. 21, 2018. doi:http://dx.doi.org/10.1101/326496.

世界血友病日|分享知识,让我们变得更强

为了纪念世界血友病联盟发起人─加拿大籍的法兰克‧舒纳波先生(Mr.Frank Schnabel ) 对于血友病患者的贡献以及唤起大众对于血友病的正确认知