Nanopore测序技术已进军Gb级别的番茄基因组领域

近日,研究者经Oxford Nanopore长读长测序技术完成了对预估基因组大小约为1G的野生番茄(Solanum pennellii)测序组装工作,文章发表于 The Plant Cell。经Nanopore测序技术组装的野生番茄LYC1722基因组,组装指标Contig N50高达2.5Mb,其基因组连续性、基因完整度及其他技术指标高于Illumina组装的番茄LA716基因组结果。结果表明Nanopore长读长测序技术以轻量级的预算已可完成Gb级别基因组的测序组装工作。

利用Nanopore测序技术的番茄基因组文章刚正式发表了,ONT 在Gb级别的动植物基因组组装情况如何?请看下文。

研 究 方 法

  1. 研究材料:选择自交亲和的Solanum pennelliiLYC1722品种
  2. Nanopore测序:共上机31个flowcells。

(1)长片段(12-80 kb,15-80 kb)筛选建库,(1D) ONT sequencing library (SQK-LSK108),20 μg DNA/library,29 个ONT MinION flowcell (R9.4)

(2)未经片段筛选建库,24 μg DNA/2 library,2 个ONT MinION flowcell (R9.4)

研 究 结 果

数据下机情况

31个flowcell总产出为134.8G,flowcell产量在1.1-7.3G范围,大部分数据都是测序运行的24h内产生的(Figure 1),其中“Passed filter”为110.96G(基本上是预估基因组1-1.1G的100X测序量),过滤后的平均Q-score为7.44,在文库优化后的产出读长,过滤的平均读长在6,625-15,869bp间,最长read可达153,099bp。

Figure1 番茄Solanumpennelli 31个MinION flowcell测序产量情况

何种基因组组装策略最优?

为评估哪种组装策略对Nanopore在植物基因组组装效果更好,研究者经Canu、SMRTdenovo、miniasm及Canu-SMARTdenovo(经Canu校正过程和SMRTdenovo组装)几种组装策略对番茄基因组进行组装,发现Canu-SMARTdenovo组装效果最优:Contig N50 达2.45 Mb,Contig总数量为899,最大的Contig为12.32Mb,另外,每种组装策略对运算条件要求都各异(Table 1)。

Table1 番茄基因组Nanopore不同组装策略结果及纠错后组装结果

研究者提取了番茄基因组Nanopore数据量的40%,60%,80%数据,经miniasm,Canu,SMARTdenovo及Canu-SMARTdenovo进行组装测试,并经二代数据polish,发现Canu-SMARTdenovo组装效果始终最优(Figure 2)。另外,经片段筛分后构建的文库每个flowcell产出20Kb以上的读长占15%,而未筛分片段的文库产出20Kb以上的读长占3%,说明protocol的优化利于后续读长产出。

Figure2 番茄Solanum pennellii不同组装策略结果对比

番茄基因组组装质量如何?

经Nanopore原始数据组装的结果表现出明显的高错误率和高误差率,而经Nanopore-based polisher Racon或Nanopolish对错误率和基因覆盖改善效果不佳,而经Illumina数据对组装结果进一步Pilon polish,发现经Pilon迭代polish能有效降低组装结果的错误率和误差率,基因覆盖完整性提高到85%-96%(Table1, Pilon polished 5X)。同时结合其他番茄品种基因组及拟南芥基因组进行基因间比较发现,相对番茄Solanum pennellii LA716,番茄Solanum pennellii LYC1772基因组组装的完整性更完善。

此次番茄基因组Nanopore测序工作得到了高质量的番茄基因组,研究者最后粗略估算了下成本,对于这种中等大小的植物基因组(<2Gb)的Nanopore测序,在当时当地情况下,项目预算低于$25000,其他开销主要是计算资源,人力成本和耗损等。另一方面,Nanopore测序下机数据含有CpG甲基化数据信息,在不需要增加成本的情况下,可利用甲基化信息对物种进行深层次的表观关联研究。

参考文献

Schmidt M H W, Vogel A, Denton A K, et al. De novo Assembly of a New Solanum pennellii Accession Using Nanopore Sequencing[J]. The Plant Cell, 2017: tpc. 00521.2017.

0 回复

发表评论

想参加讨论吗?
请尽情讨论吧!

发表评论

邮箱地址不会被公开。 必填项已用*标注