Science首秀!看Nanopore如何杠上拉沙热病毒

过去三年,

有一种病毒疯狂肆虐

几内亚(科纳克里)、利比里亚、

塞拉利昂和尼日利亚部分地区!

2018年,

更是一发不可收拾!

截止2018年3月,仅尼日利亚

疑似病例就达1495例!

不排除其它西非国家存在的可能…

拉沙热听过?

一种主要通过动物传染的病毒性出血热疾病,

一旦感染,人畜共患!

Fig.1 2018年1月1日-3月18日拉沙热确诊病例分布图。(A) 受影响国家;(B)测序样本来源(橙色标记)

拉沙热病毒(LASV)是一种RNA病毒,且基因组高度可变,L区段(基因组大片段,编码RNA聚合酶和锌结合蛋白)和S区段(基因组小片段,编码糖蛋白和核蛋白)的种间核苷酸变异高达32%和25%,很难用短读长扩增子测序的方法准确检出。

怎么办?不忍看到水深火热中的西非人民继续遭罪,英格兰公共卫生署的Liana Eleni Kafetzopoulou及其同事们想到了纳米孔测序技术。对了,就是一种比U盘大不了多少的MinION纳米孔测序仪,通过对36个基因组及120份临床样本进行实时宏基因组测序分析,帮助他们揭示了LASV的多样化及其与早期发现的毒株的系统发育相关性,研究成果于2019年1月4日登上Science杂志——学者仁心,大大的赞!

Fig.2 样本测序时间轴

研究者调取了120份LASV-阳性临床样本,7周内搞定测序(Fig.2)。为了弄明白产生病毒间的亲缘关系,研究者将basecall reads和原始信号数据映射到参考序列上,使用Nanopolish进行突变体检测。对于非人源序列,研究者用canu进行了de novo组装,平均每个样本中包含LASV序列4.26%—42.9%,组装出了可以对91个样本中至少一个直系同源片段进行系统发育构建的矩阵。

研究者还留了个心眼,用Illumina测序对14个SISPA文库测序进行验证,发现Nanopore与Illumina序列高度一致,所以三代测序就是这么牛,靠谱,还走哪带到哪(Table 1)。

研究采用Centrifuge软件对110号样本进行宏基因组分类,鉴定出其中0.10%的reads源自甲型肝炎病毒,20×的测序深度达到了74%的基因组覆盖率。在同一个样本中,LASV reads占到了0.83%,达到了96%的基因组覆盖率。说明啥?嗯,哪怕多个长得很像的RNA排排站,Nanopore都能火眼金睛,一眼看穿——那些作为混合感染存在的病毒也无一例外!

那么,2018年尼日利亚拉沙热爆发的分子流行机制又是怎么回事?

别急,研究者使用生成的LASV序列及一些已有序列构建了拉沙热病毒系统发育树,真正的寻根溯源!基于S区段的最大似然法构树显示:2018年的LASV毒株都归属于尼日利亚LASV变种,尤其是Ⅱ型和Ⅲ型(Fig.2)。这个结果与基于L区段构建的系统发育树仅有7个毒株不一致。最后,真相大白:啮齿动物宿主污染是2018年拉萨热爆发的主要原因。所以奉劝小伙伴,没事零食别到处乱扔……

所以说,纳米孔测序技术在宏基因组学研究及疾病传播研究中的价值不容小觑,再加上实时测序、快速分析等其他技术无可比拟的优势,真的可以造福人类。这个研究缓解了人们对拉沙热在人际间广泛传播的恐惧,使公共卫生资源得到了合理分配,还指出LASV防治重点是加强社区鼠类控制、环境卫生和食品储存安全。

参考文献

Kafetzopoulou, L. E., Pullan, S. T., Lemey, P., Suchard, M. A., Ehichioya, D. U., Pahlmann, M., … Wozniak, D. M. (2019). Metagenomic sequencing at the epicenter of the Nigeria 2018 Lassa fever outbreak. Science, 363(6422), 74–77. doi:10.1126/science.aau9343 

0 回复

发表评论

想参加讨论吗?
请尽情讨论吧!

发表评论

邮箱地址不会被公开。 必填项已用*标注