Nanopore测序可得1Mb的超长读长?!

依据当前高通量测序技术发展,虽说现在仅花费几小时就可以组装出细菌基因组的完成图,但是你是否打开脑洞的想过,我们是否可以不组装,只需要1条read就可得到细菌基因组的全部信息?现在,Nanopore纳米孔测序的超长读长给了脑洞成为现实的可能。

当然,目前一条read就可测得一株细菌基因组信息的脑洞还没法立刻成为现实,但已有研究者通过优化样本提取、建库和上机条件后,可通过nanopore测序数据中的一条read覆盖全基因组序列的1/6。

优化流程

对过夜培养的E. coli K-12 MG1655 经Sambrook protocol提取,得到高分子量DNA(>60Kb),OD260/OD280 =2.0

通过前期测试经验,将建库起始量调整至20ug

最后,文库加载到1个标准的FLO-MIN106 flowcell (R9.4) 上机测序。

下机数据

最后下机总数据量为5,014,576,373bp,共150,604 条read,read N50为63,747bp,平均read长度为33,296bp。其中,前面最长的10条read分别为1,113,805bp, 916,705bp, 790,987bp, 778,219bp, 771,232bp, 671,130bp, 646,480bp, 629,747bp, 614,903bp, 603,565bp。

Figure 1E. coli K-12 MG1655下机数据读长分布

数据比对

经GraphMap工具将数据集比对到参考基因组,其中95.46%的序列可比对到参考基因组上,平均比对读长高达34.7Kb。

前面最长的10条比对读长分别为778,217bp, 771,227bp,671,129bp,646,399bp,603,564 bp,559,415bp,553,029bp,494,330bp,487,836bp,470,664bp,从理论上来说,7条最长的reads就可对4.6Mb大肠杆菌基因组进行覆盖。

Figure 2E. coli K-12 MG1655数据比对后读长分布

Nanopore测序技术中无PCR,无DNA合成,最终得到read长度很大一部分取决于文库模板DNA长度和质量,因此对DNA总量、纯度、完整性要求严格。

参考文献

Loman, N. J. Thar she blows! Ultra long read method for nanoporesequencing accessed 2017-05-08.

0 回复

发表评论

想参加讨论吗?
请尽情讨论吧!

发表评论

邮箱地址不会被公开。 必填项已用*标注