Nanopore测序仪完成迄今最连续的人类基因组组装,牛津纳米孔公司携手未来组已启动“1000个中国人基因组结构变异检测计划”

1月29日,Nature Biotechnology在线发表基于Nanopore超长读长组装人类基因组的研究论文[1]。研究结果显示:低覆盖深度测序(~30×普通nanopore reads+ ~5× ultra-long reads)即能将基因组Contig N50组装到6.4Mb,填补了参考基因组(GRCh38)中12个gaps,这是来自单一测序手段得到的迄今最连续的人类的基因组。可以说,这项成果标志着Nanopore测序技术达到了新的里程碑,同时向最终完成人类基因组再次迈出了新的一步。

人类基因组组装的全新时代

文章的主要作者之一、诺丁汉大学医学副教授Matthew Loose表示:“完成这项成果意义重大,这是第一次在纳米孔测序仪上产生足够的数据来进行人类基因组的重新组装。”

研究人员通过Nanopore MinION测序平台一共测了39个flow cells ,产出91.2Gb数据,其中read N50为10589bp。超长的read部分用了另外的14个flow cells ,平均每个flow cell 可以产出2.3Gb的数据,其中read N50在100kb以上,最长读长达到了882kb,使研究人员能够对过去技术分析不了的人类基因组区域进行测序,检测先前难以攻克的复杂区域。比如,该研究所述方法可以检测基因组中的结构变异和表观遗传修饰,填补人类参考基因组GRCh38中的12个gaps,从而提高了参考基因组的准确性,而在高度重复的序列中,较短的reads是不可能做到的。对此,Loose教授解释道:“你可以想象有这样一副拼图,拼图上的两个区域有着相同的图像,那么就没有办法去分辨哪一部分应该在哪里。但当你获得的reads越来越长,就会在这些reads中获得更多独特的元素,从而让你看到它们应该在哪里。”此外,超长reads使得本研究能够识别整个MHC区域(基因组中最密集且高度可变的区域之一),并通过超长序列数据成功重建了2个杂合等位基因,这是MHC首次在二倍体人类基因组中被准确地定向。

 数据集总结

 超长reads、组装及端粒

此次Nanopore测序组装人类基因组研究论文的发表,对新测序技术的推广应用和更连续的人类参考基因组在临床医学研究中的应用意义深远。

希望组CEO汪德鹏在与测序中国的对话中表示:“Nanopore技术经过多年的发展,已经逐步成熟,本次采用MinION完成一个人类基因组组装项目,预示着基因组组装已经进入一个全新的时代,快速、低成本、高质量、接近完成图的基因组研究,将成为最近两年全球的研究热点。”

纳米孔测序技术,未来值得期待

迄今为止,纳米孔测序技术主要用于微生物基因组的测序,例如跟踪非洲的埃博拉病毒的爆发或美洲的寨卡病毒。本次最新研究证明其能够进行人类基因组测序,可能会促进纳米孔测序在其他应用领域的普及,这无疑会让一些研究人员开始考虑将MinION用于测序更大的基因组。尽管这种“袖珍”设备对整个人类基因组进行常规测序的速度仍然缓慢,但是一些工作已经表明,纳米孔测序比用于检测复杂染色体重排的短读取技术更为出色,如在一些癌症和罕见遗传性疾病中。

尽管纳米孔测序技术还并不完全成熟,但SanDiegOmics.com基因组顾问Shawn Baker表示:“随着测序平台的普及,情况应该会逐渐改善。”

如今,使用纳米孔测序技术进行从头组装的大规模基因组项目持续火热,针对国内的进展,CEO汪德鹏跟测序中国提到:“2016年我们参与发表了基于PacBio SMRT技术的长读长中国人参考基因组‘华夏一号’,成功的补上了国际人类基因组参考序列的25%的漏洞。现在,我们又启动了基于Nanopore技术的‘华夏一号’样本的测序,希望能得到更加完整的中国人基因组参考序列。与此同时,我们还将利用已经构建的20台Nanopore GridION平台(MinION的5倍通量),完成中国人类基因组结构变异数据库的构建,目前已经启动了20个样本的测序,计划于两年之内完成1000个中国人样本。”

我们也相信,随着单分子测序技术的不断发展和普及,未来这项技术必将在生命科学领域发挥出更大的力量。

参考文献

[1] Jain M, Koren S, Miga KH, etal. Nanopore sequencing andassembly of a human genome with ultra-longreads.Nature Biotechnology, 2018

0 回复

发表评论

想参加讨论吗?
请尽情讨论吧!

发表评论

电子邮件地址不会被公开。 必填项已用*标注