Nextomics产品速递—-基因组denovo 3.0 (三代测序那些事儿 第六期)
在这期的三代测序那些事儿里,小编为大家介绍一个基于PacBio SMRT三代测序技术的新型基因组解决方案“基因组denovo 3.0 ”。该方案是由我们未来组(Nextomics)信息分析部的同事经过两年多时间的研发,各项参数在三四个大型动植物基因组、数百个小基因组的组装过程中反复优化,最终将这一国内目前最给力的基因组解决方案呈现给大家。
在推出我们的基因组denovo3.0之前,先上一个我们最近的一个超高杂合度的植物基因组的纯三代数据组装实例让各位小伙伴感受下:
该植物基因组的杂合度高达耸人听闻的3%,一般情况下杂合度大于0.8%的基因组便被划入了复杂基因组的范畴,3%的杂合度对于玩基因组组装的人来说绝对算的上一个噩梦。
杂合度问题一直是困扰传统的短读长 NGS 测序平台的固疾,因此面对这种超高杂合度的植物基因组,我们直接摒弃了NGS测序平台,转而使用了一种超长读取(平均读长约15kb)的新型测序技术PacBio SMRT,该技术小编已经在前面几期的文章里详细阐述,这里不作过多介绍。
我们使用了70X的纯PacBio数据,利用针对PacBio数据开发的、专门解决二倍体多倍体组装的最新组装算法FALCON对该基因组进行了组装,各项参数经过多个版本的调试,最终得到了ContigN50 值406kb的傲人战绩。与之前国内某巨头公司使用NGS数据组装得到的 18.5 kb 相比,完全高出一个数量级。
当然基因组组装的记过不能只看 ContigN50 指标,毕竟部分组装软件在这个问题上采用了选取最长路径的粗暴做法。因此,我们使用之前得到的该植物的根、茎、叶、穗四个部位的mRNA数据对基因组组装的准确度进行了一个评估,并与之前的NGS组装版本进行了比较,基因区覆盖度结果如下:
穗 PacBio VS NGS 91.09% VS 88.92%;
叶 PacBio VS NGS 87.33% VS 87.98%;
根 PacBio VS NGS 89.41% VS 89.39%;
茎 PacBio VS NGS 91.73% VS 90.20%。
因此,在准确度上,PacBio也是绝对是不输于NGS的。
除过纯三代数据组装,我们二三代数据混合组装的案例杜仲基因组也在去年12月份北京的新闻发布会上为大家呈现过,在这个案例中,我们仅在NGS数据中引入了8.7X的PacBio数据,使用SSPACE、PBjelly、Platanus等软件对这个杂合度大于1%,重复序列比例大于66%的复杂基因组进行了组装,最后的ScaffoldN50接近了1M,通常情况下这一数值小于300kb,详细信息大家可进入链接http://news.china.com.cn/2014-11/26/content_34156870.htm。
感受完我们的demo case强力气场后,小编这就拿出我们的基因组denovo 3.0
1)动植物基因组 denovo 3.0
测序平台:PacBio RSII
测序深度:50X-100X(~20kb文库)
预计指标:ContigN50 >500kb ,ScaffoldN50>1M (20X BioNano辅助)
最新科研思路:多倍体起源进化、微进化(泛基因组)等[1-4]
2)微生物基因组 3.0
测序平台:PacBio RSII
测序深度:100X-200X
承诺指标:细菌完成图(No GAP ,NO N);
真菌接近完成图(ContigN50>800kb);
5mC、4mC、6mA修饰位点检出
最新科研思路:致病菌相关研究[5-8]
最后欢迎访www.nextomics.cn了解更多的三代测序产品。
Paper:
[1] De novo assemblyof soybean wild ralatives for pan-genome analysis of diversity and agronomictraits.
[2] Highly evolvablemalaria vectors: the genomes of 16 Anopheles mosquitoes .
[3] Earlyallopolyploid evolution in the post-neolitihic Brassica napus oilseed genome.
[4] Achromosome-based draft sequence of the hexaploid bread wheat (Triticumaestivum) genome
[5] The extant Wordwar1 dysentery bacillus NCTC1: a genomics analysis.
[6] Single- moleculesequencing to track plasmid diversity of hospital-associated carbapenemaseproducing enterobacteriaceae.
[7] Emergence ofscarlet fever Streptococcus pyogenes emm12 clones in Hong Kong is associated withtoxin acquisition and multidrug resistance.
[8]A random six-phse switch regulates pneumocaccalvirulence via global epigenetic changes.
发表评论
想参加讨论吗?请尽情讨论吧!