2.2Mb! 纳米孔测序再创单read 读长新纪录!

Nanopore测序首次生成了单个>2Mb的测序序列,这是Nanopore测序史上的又一飞跃。该研究由英国诺丁汉大学生命科学学院Alexander Payne等人主导,研究成果已于5月3日在bioRxiv发布[1]

NanoporeMinION测序输出数据为fast5格式,经过base calling 步骤获得相应的碱基序列(fastq格式)。此前基于MinION的base calling软件通常为MinKNOW。而Alexander Payne等人基于开发的BulkVis工具,发现MinKNOW在base calling过程中可能会将长reads错误打断,而消除这个“bug”之后,可获得读长超过2Mb的reads。

为什么要获得长读长?

获得完整的高质量的基因组信息是深入进行物种研究的前提。

二代短读长测序技术将基因组DNA打断为几百bp的小片段,测序后再逐步拼接,组装连续性差,尤其难以解决基因组中的复杂的重复区域和结构变异区域,很难获得完整的基因组组装结果。

Nanopore测序技术的长读长在基因组组装中优势明显,不仅可以大大提高基因组组装的连续性,还可以解决短读长测序所难以攻克的复杂重复序列,对结构变异的鉴定也有很大的优势。例如近期在Nature Biotechnology上发表的基于Nanopore测序获得的人类Y染色体着丝粒序列的文章,展示了Nanopore测序在解决复杂重复区域的优越性。此外,对线虫基因组中的复杂串联重排、果蝇基因组中的结构变异的鉴定等都是Nanopore长读长测序的应用实例(相关文献解读见文末延伸阅读)

案例一Nanopore完成某昆虫基因组组装

基于K-mer分析预估该昆虫基因组大小为~330Mb。

Fig.1K-mer分析

提取合格的样本DNA,在Oxford Nanopore GridlON X5平台测序30Gb三代数据,最长读长达270Kb,reads N50长度达26.8kb。长读长是后续进行更准确基因组组装的前提。

Fig.2读长分布

利用多种软件进行基因组组装,配适最优方案。基于超长读长的Nanopore测序和搭配的超算平台,让基因组组装更连续,更快捷。本案例中,该昆虫基因组组装Contig N50能>7Mb,已达到昆虫模式动物果蝇的组装水平。

Table1 组装结果

将组装的基因组通过 BUSCO比对昆虫基因组数据库,评估对保守基因组装的完整度,间接f反映整个基因组完整度。结果表明,经过Nanopolish+Pilon(×2)校正后,BUSCO评估能达到~98%,基因组组装完整性好。

Table2 BUSCO评估

案例二某动物ultra-long 测序数据惊艳首发

Nanopore ultra-long测序可实现超长读长,根据其独特的转座酶建库方式,可以获得含有超长片段的DNA测序文库,再通过Nanopore测序即可获得超长的DNA序列。超长序列将大大有利于基因组de novo组装及染色体复杂结构变异的鉴定等。

Fig.3Ultra-long 建库测序流程

未来组基于Nanopore 测序平台,对某哺乳动物血液进行ultra-long建库并测序,多个文库的reads N50长度大于70kb,最长读长超过1Mb!

Fig.4部分文库reads N50

Fig.5 单个文库读长分布

未来组迄今已完成数十个Nanopore动植物基因组测序组装,并与牛津纳米孔公司携手推出“1000个中国人基因组结构变异检测计划”,共同开发Nanopore技术在生命科学领域的新应用。未来组将持续扩大Oxford Nanopore测序平台,打造包含三代单分子测序、光学图谱、三维基因组学等多方位的组学研究中心,还将在RNA直接测序、表观转录组学等领域进行深度的探索。

 

参考文献:

[1] Alexander Payneet al. Whale watching with BulkVis: A graphical viewer forOxford Nanopore bulk fast5 files. bioRxiv.2018.

[2]https://nanoporetech.com/about-us/news/longer-and-longer-dna-sequence-more-two-million-bases-now-achieved-nanopore

延伸阅读

NBT丨Y染色体着丝粒序列解析完成的一小步,人类基因组完成图历史上的一大步

近期两篇Nanopore组装果蝇基因组文章预印,低于$1,000 价格又搞定一个模式生物

来自Nanopore测序的2个线虫基因组,解析复杂的染色体重排

0 回复

发表评论

想参加讨论吗?
请尽情讨论吧!

发表评论

邮箱地址不会被公开。 必填项已用*标注