三代测序那些事儿(第三期)

世界那么大,我想去看看,但钱包和老板不让。

所以,小编只能暂时继续安分的坚守在工作岗位上挥发自己的光和热。

好了,言归正传,上期为大家盘点了那些使Pacbio SMRT异军突起的核心技能,加上第一期中提到的该测序君在亚洲人类基因组计划中的强悍表现,相信大家已经感受到了Pacbio SMRT君那点超凡脱俗的小气质。

超凡脱俗的气质的养成还得从Pacbio SMRT君的诞生过程说起。

小编搜罗整理了从2003年Pacbio SMRT君最核心元件ZMWs概念出现到2011年Pacbio SMRT君在海地霍乱菌研究中的牛刀初试之间的7篇Paper以及相关事件,这7篇Paper基本构成了Pacbio SMRT君的诞生简史,也是大家想要了解Pacbio SMRT君不得不读的Paper。

这期小编将为大家奉上这7篇文献及其解读,继续帮助想要了解三代测序的小伙伴快速入门。

源于微波炉门的灵感让当时还在康奈尔大学读研的Stephen Turner 与 John Korlach两个人想到了一个实现生物反应过程单分子检测的巧妙想法,利用一个超级微缩版的微波炉门ZMWs结构来检测单条DNA链的合成过程,这一猜想很快被他们发表在2003 Since上的一篇Paper论证,接下来便是一个微波炉门引发的测序技术PacbioSMRT的诞生之路。

Paper1 便是对那个“微波炉门猜想”的论证。

Paper 1(2003年):

Zero– Mode Waveguides for Single-Molecule Analysis at High Concentrations .

该研究中,Stephen Turner(Pacific Biosciences创始人)等人论证了利用一种称为零模波导(Zero-Mode Waveguides,ZMWs)的金属穿孔状元件在生物反应浓度(μM)条件下进行单分子检测的可行性。

该孔状结构直径在100nm左右,使用波长为几百纳米(>1.7倍孔径)的激发光从孔底部射入时,无法在孔中传播(孔中无光模式存在,因此称为零模波导ZMWs),只能在ZMWs底部衍射形成一个极小的激发场/观测体积(observation volume)。

经推算,该激发场的体积在仄升(10-21L)级别,相当于在μM体系中该激发场中仅存在单个荧光标记分子(有效的排出了DNA测序过程中背景荧光的干扰)。

研究最后,Stephen Turner等人利用ZMWs结构对单条M13噬菌体DNA链的体外合成过程进行了监测,使用香豆素标记的dNTP(7.5μM)作为反应指示物,监测得到的合成时间(30min)、合成速度(10 to 15 bases per second)等参数与预期相符。

研究结构证明了Stephen Turner 等人可利用ZMWs进行生物反应过程单分子检测(单条DNA链合成过程监测)的猜想是正确的,大约在10年后由Pacific Biosciences公司发布的DNA单分子实时测序平台Pacbio RS便是采用这一结构(SMRT Cell)实现了单分子测序。

2004年,致力于一种单分子测序平台研发的PacificBiosciences公司(以下简称Pacbio)成立(来自维基百科),Pacbio SMRT君的诞生之路也正式开始。

Paper2(2008年):

Long, processive enzymatic DNA synthesis using 100% dye-labeled terminal phosphate-linkednucleotides.

该研究中,Stephen Turner等人针对正处于研发阶段的Pacbio RS系统开发了一种新型的dNTP荧光标记技术。

摒弃了当时主流NGS测序技术中将荧光基团标记于dNTP碱基的做法,而是将荧光基团标记于dNTP的磷酸链末端(参照2005年一篇HIV反转录酶研究中的dNTP标记方法),合成过程中,荧光基团随着焦磷酸基团被聚合酶自然切除,不会渗入到合成的DNA链中,无需各类洗脱试剂,最大限度的保持了DNA聚合酶的活性。

Stephen Turner等人使用一个人工合成的环状(72bp)DNA作为模板,Ф29聚合酶介导的,磷酸链末端荧光标记的dNTP作为反映底物的 PCR反应对该类新型荧光标记dNTP读长潜力进行了测试,琼脂糖凝胶电泳结果显示,5min后扩增长度达到3kb(未标记dNTP对照组 4.5kb,碱基标记dNTP对照组无扩增条带),20min后扩增长度达到了10kb。

该结果显示了此类新型dNTP标记技术带来的边合成变测序过程中(SBS)超长读取潜力,这一技术使日后的Pacbio SMRT君具有了超长读取的能力,避免了另一位在上期提到的三代测序君HeliScope出师未捷身先死的悲剧。

Paper3(2008年):

Parllelconfocal detection of single molecules in real time.

在该研究中,Pacbio工程师门描述了一种内置有可产生数千个激发通道的全息相位掩膜(holographic phasemask,HPM)与高帧率(100HZ)电子倍增CCD相机(EMCCD)的荧光共聚焦显微镜系统,该系统被整合到了后来的Pacbio RS平台中,实现了对DNA测序过程中的实时监测,得到了DNA聚合酶的动力学信息,为后续的碱基修饰信息挖掘提供了数据支持。

至此,Pacbio SMRT君已初具雏形,Pacbio公司也于2009年公布了Pacbio RS的首批测试数据,并对其所产生的数据特点进行分析。

Paper4(2009年):

Real-timeDNA sequencing from Single Polymerase Molecules(1).

在这篇研究中,Stephen Turner等人主要对刚刚公布的Pacbio RS首批测序数据特点(一个72bp人工的环形DNA模板与一个150bp线性DNA模板下机数据)进行了分析。

读长评估:

环形DNA模板测序下机数据显示(仅标记dCTP dGTP),DNA聚合酶活性通常可以持续数千秒,平均读长1kb,部分读长超过4kb,聚合酶活性持续1小时以上,聚合酶基本保持了其内在的合成速度2~4 bases/s。

准确率评估:

线性DNA模板测序下机数据显示(标记所有类型dNTP),提取其中一条158bp的read比对回模板链,发现了27个测序错误,12个单碱基缺失错误,8个单碱基插入错误,7个错配错误,原始错误率17%。

进而对提取出的449条reads做同样分析,发现缺失错误占主要部分(7.8%),插入错误其次,错配错误所占比例最小(主要为C/G错误)。

通过对上述449条reads中每个碱基对应的脉冲宽度(plus width)与脉冲间隔(interplus duration)进行统计分析,显示这两个参数非常稳定,与序列碱基无关,因此,测序过程中的原始错误时随机分布的,无碱基或者序列偏好性。

最后研究者使用15X测序深度的线性模板测序数据得到了准确率99.3%的一致性序列。

Pacbio SMRT的初测基本取得了预期效果,首批测序数据的特点分析也为后期配套软件的开发提供了方向。

随着测序试剂的更新换代以及新型校正算法的出现,目前的Pacbio RSII的平均读长已达15kb,50X-100X测序数据可产生准确率为  99.9999%(Q40)的一致性序列。

Paper5(2010年):

Real-timeDNA sequencing from Single Polymerase Molecules(2).

初测数据公布后的,Pacbio也于2010年开始对部分客户发售其第三代测序平台Pacbio RS进行早期的客户评估,这些客户包括贝勒医学院、冷泉港、马里兰大学、哈佛医学院等顶级科研机构。

Pacbio在同年的这篇Paper基本为一个Pacbio RS 系统说明书,其中包含了系统的主要组成部分以及操作分析流程,这里不作过多介绍,有兴趣的小伙伴可以自行下载阅读。

Paper6(2010年):

Awindow into third-generation sequencing .

Pacbio RS系统开始进行早期客户测试的同年,Pacbio公司发表了第一篇介绍Pacbio SMRT的综述性文章,为其发售助势。

在这篇文章中,Stephen Turner等人对其第三代测序平台结构、原理、优势进行了综合论述,同时概括了Sanger、NGS测序技术发展史与其他类型的三代测序技术。

详细内容在前两期以及本期其他文献部分均有体现,此处不做过多介绍。

2011年6月份,新英格兰杂志NEJM发表了Pacbio SMRT在海地霍乱弧菌研究中应用,标志着Pacbio SMRT开始真正应用于科学研究,Pacbio SMRT君正式开始了其在科研道路上的探索。

Paper7(2011年):

Theorigin of the Haitian Cholera outbread Strain.

该研究中,哈佛医学院的研究人员利用Pacbio SMRT技术对2株分离于2010海地霍乱爆发中的霍乱弧菌H1、H2以及另外3株分别分离于拉丁美洲、南亚霍乱爆发中的霍乱弧菌C6、M4、N5进行了测序,研究者使用了环形一致性读取(circle consensus sequencing ,CCS)方式。

为确定海地霍乱爆发中霍乱弧菌的传播源,研究者首先比对了上述H1、H2、M4、C6、N5 以及之前基因组已经发表的其他23株霍乱杆菌中1588个保守基因区域的CCS reads,通过单核苷酸突变(single nucleotide variation,SNVs)位点信息,得出海地霍乱弧菌H1、H2与分离于孟加拉国的霍乱弧菌M4、CIRS101有着非常近的亲缘关系。

研究者进一步利用pacbio SMRT技术长读长的优势(H1、H2测序平均读长954bp,5% > 2.8 kb),将H1、H2、M4所有CCS reads比对到参考基因组N16961上,检出了Superinetegron、VSP2 等基因组热点重组区域的结构变异(Structural Varition,SV)位点信息,SVs信息显示,相较于M4,H1、H2与CIRS101有着更近的亲缘关系。

该研究表明2010年爆发于海地的霍乱弧菌很可能来源于2002年孟加拉国的一场霍乱弧菌爆发。

2011年,Pacbio公司开始商业发售期第三代测序平台Pacbio RS,Pacbio SMRT君也开始了进军全球的步伐。

想要了解更多三代测序信息,就关注我们的微信公众平台吧,微信号Nextomics,这个平台绝对只送干货。

声明:本文原创,转载请注明来源

0 回复

发表评论

想参加讨论吗?
请尽情讨论吧!

发表评论

邮箱地址不会被公开。 必填项已用*标注