三篇全长转录组Iso-seq应用案例解析:动物、植物、微生物全覆盖

转录组学研究可以在整体水平上研究细胞中所有基因的表达调控规律,在分子水平上反映个体的生理生化过程。二代测序技术的应用使得人们得以初探转录组,但由于其短读长的技术限制,始终无法准确获得完整转录本。而三代长读长测序技术PacBio SMRT以其平均15~20kb的长读长优势,可以轻松覆盖转录本全长,使得人们终于可以窥得转录本全貌,为人们获取个体全长转录本并进行差异化分析、了解生命内在规律提供了新的解决方案。以下组学君为您带来三篇全长转录组Iso-seq应用案例解析,看看能不能为您带来新思路。

案例一

构建空心莲子草叶甲全长转录本集合[1]

TitleSMRT sequencing of full-length transcriptome of flea beetle Agasicles hygrophila

JournalScience Reports(February 2018)

IF:4.259

空心莲子草是原产于南美的苋科植物,在十九世纪30年代进入中国并迅速成为入侵物种,对当地的生态系统造成了破坏。空心莲子草叶甲是空心莲子草的专性天敌,作为生物防治手段而被引入。研究者对其进行了全长转录组研究,获得较完整的转录本集合,为了进一步揭示空心莲子草叶甲与宿主植物和生态系统之间的互作关系打下基础

材料与方法

物种:空心莲子草叶甲(Agasicles hygrophila)

取样:分别提取四个生长阶段(卵、幼虫、蛹、成虫)的RNA后混合测序

测序策略:PacBio SMRT

结果分析

文章应用部分篇幅阐述了PacBio SMRT Iso-Seq与RNA-Seq相比的长读长优势(Table 1):通过Illumina测序获得的reads读长有70%分布在200-300bp,而PacBio SMRT则有超过69%的reads读长超过1kb。Iso-Seq共产生9.4Gb clean数据,158,085条FLNC reads。完整地读取转录本的全长,有助于更精准地进行转录本重构和基因注释。

Table 1 PacBio SMRT与Illumina测序结果比较

文章基于PacBio SMRT数据,做了进一步的全长转录组标准分析,重构了28,982 条转录本,预测了145个可变剪接事件;27,318条简单重复序列;经TransDecoder鉴定获得24,040个ORF,其中有16,205个完整的ORF;预测得到4,198个lncRNA。同时,研究者还用多个数据库对空心莲子草叶甲基因进行了注释。

该研究利用长读长测序手段首次完成对空心莲子草叶甲的转录本研究,4分SCI妥妥到手,同时也为后续进一步研究昆虫与宿主植物和生态系统之间的互作关系提供了很有价值的参考信息。

案例二

比较转录组学:自然选择的摩擦草属VS人工选择的玉米[2]

TitleParallels between artificial selection in temperate maize and natural selection in the cold-adapted crop-wild relativeTripsacum

JournalbioRxiv(September2017)

摩擦草属、玉米和墨西哥类蜀黍的亲缘关系很近,但摩擦草属对寒冷气候适应性更强。研究者利用三代Iso-seq获得摩擦草全长转录组,结合已发表的玉米参考基因组和蜀黍植物基因组数据,进行个性化比较分析,以期在不断变化的气候条件下,为人工培育农作物提供思路。

材料与方法

物种:摩擦草(Tripsacum)

取样:提取野生摩擦禾种子发芽生长的单一植株的根、叶和茎RNA后混样测序

测序策略:PacBio RSII

结果分析

选取摩擦草属和玉蜀黎属为目标物种,高粱属、狗尾草属、复活草属为背景物种,稻属、短柄草属为外参物种,构建系统进化树。发现摩擦草属和玉蜀黎属中的6,950个直系同源基因在七种草类物种共有,包括4,162个一对一,1,436个一对二和1,352个二对二直系同源基因集,说明玉米和摩擦禾可能拥有相同的全基因组复制情况,二者的亲缘关系很近。

Fig.1 系统进化树

利用PacBio Iso-seq测序技术获得摩擦草的全长转录组与玉米参考基因组(RefGen v3)进行比较分析,发现玉米转录组中包含更多的可变剪切事件,且在玉米和摩擦禾的直系同源基因中发现有超过2/3(656, 61.6%)的保守基因发生可变剪切,而409个基因是玉蜀黍属-摩擦草属所特有的;在摩擦草中发现249个lncRNA,平均长度1.45kb,比玉米用PacBio Iso-seq技术测得的lncRNA的平均长度(0.67kb)长,且仅有17个lncRNA与玉米表现为高度一致性。

Fig.2 (a)摩擦草和玉米之间Ka / Ks比值的分布散点图; (b)摩擦草中磷脂代谢基因与其他功能基因的Ka / Ks比值分布图

脂质具有防止细胞膜在低温条件下损伤的作用,因此膜脂质组成的变化可能是与摩擦草的耐冷性相关。研究者比较玉米和摩擦禾中相同基因之间的Ka / Ks值,发现磷脂生物合成途径中的基因显示比背景基因更高的Ka / Ks比值,说明参与磷脂代谢的基因加速了物种的进化过程(Fig.2)。研究指出摩擦草中参与磷脂代谢的相关基因中的蛋白质序列的加速进化可能是造成摩擦草属相对于玉米更耐寒的原因。

案例三

动态转录组监控裂殖酵母减数分裂过程中Isoform水平的多样性[3]

Title:The dynamic landscape of fission yeast meiosis alternative-splice isoforms

Journal:GenomeResearch(January 2017)

IF11.922

可变剪接增加了后生动物转录组和蛋白质组多样性,但人们对于单细胞生物的可变剪接事件还知之甚少。研究者以裂殖酵母为模型,利用三代长读长测序技术的同时开发了SpliceHunter软件用以对其进行转录组的可变剪接事件进行动态分析。

材料与方法

物种:裂殖酵母(Schizosaccharomyces pombe)

取样:在0-10h内间隔2h取样,分别提取RNA测序

测序策略:PacBio RSII

结果分析

从PacBio测序获得的Iso-seq reads 平均长度为1178 bp,共发现了S. pombe中~90%(6,199个)的基因。研究者发现在裂殖酵母的减数分裂时期,发现17,669个异构体,发生了14,353个可变剪切事件,其中,内含子保留是最主要的可变剪接形式(Fig. 3)。研究反映了裂殖酵母S. pombe转录本的复杂性:~1300个基因发生了一次可变剪接,1432个基因发生了两次可变剪接,而发生了2次以上的可变剪接事件的基因超过3000个。

Fig.3 S. pombe中的可变剪接事件

Fig. 4 减数分裂期间不同可变剪接形式的变化趋势

研究发现在裂殖酵母减数分裂期间,大部分的可变剪接类型都有所增加,仅有外显子跳跃类型的可变剪接在减数分裂初期处于低水平而在减数分裂末期有所增加(Fig.4)。这种变化反映了S. pombe在有丝分裂和减数分裂期间的一种条件驱动的可变剪接机制。研究结果反映了裂殖酵母性发育过程中Isoform水平的多样性和动态变化。

由此可见,基于三代长读长测序的Iso-seq技术跨越了传统测序技术无法克服的鸿沟,极大地丰富了对转录本结构的研究,可准确辨别二代测序无法识别的异构体(Isoform)、融合基因、lncRNA等,获得更加全面的注释信息。

未来组的全长转录组学研究,不仅包含PacBio SMRT技术,也已推出基于Nanopore的direct RNA测序技术,开启转录组学研究新纪元,我们有丰富的全长转录组项目经验,针对特定项目,对分析流程进行优化,以期为不同领域的研究者提供更为完善的解决方案。

参考文献

[1]Jia D, Wang Y, Liu Y, et al. SMRT sequencing of full-length transcriptome of flea beetle Agasicles hygrophila (Selman and Vogt)[J]. Scientific reports, 2018, 8(1): 2197.

[2] Yan L, Lai X, Rodriguez O, et al. Parallels between artificial selection in temperate maize and natural selection in the cold-adapted crop-wild relativeTripsacum[J].bioRxiv, 2017: 187575.

[3]Kuang Z, Boeke J D, Canzar S. The dynamic landscape of fission yeast meiosis alternative-splice isoforms[J]. Genome research, 2017, 27(1): 145-156.

延伸阅读

研究全长转录组?建议先看看这几篇文献

Nature methods丨基于Nanoporedirect RNA测序方法测评

异源四倍体棉花全长转录组文献精读

从已发表paper中找找全长转录组研究套路

0 回复

发表评论

想参加讨论吗?
请尽情讨论吧!

发表评论

邮箱地址不会被公开。 必填项已用*标注