项目文章|三代转录组测序揭示精子中完整Long RNAs图谱

2021.03.01,Nature Communications杂志在线发表题为“Single-molecule long-read sequencing reveals a conserved intact long RNA profile in sperm”的研究论文,由美国罗切斯特大学李鑫团队与爱荷华大学(现俄亥俄州立大学)区健辉团队合作发表。该研究利用三代测序技术检测了精子细胞中完整的 long RNAs(spiRNAs),在小鼠和人类精子中分别检测到了3440和4100种 spiRNAs。结果显示,这些spiRNAs种类上包含mRNA和long non-coding RNAs,进化上spiRNA在小鼠和人类之间是相对保守的,并且在编码核糖体的mRNAs中显示富集。该研究描述的完整long RNAs图谱为进一步研究其生物成因和功能提供了基础,同时本研究中的策略和自主开发的生物信息分析流程为其它类型样本完整longRNAs鉴定提供了参考。希望组提供了本次研究的部分三代测序服务。

文章题目:Single-molecule long-read sequencing reveals a conserved intact long RNA profile in sperm
发表期刊:Nature Communications
发表时间:2021.03.01
影响因子:12.121
测序技术:Pacbio Iso-Seq、Illumina、Nanopore cDNA全长转录组

研究背景
在受精过程中,精子会向合子传递多种RNAs,早期研究已经证实这些RNAs能参与调节表观遗传,响应环境因子从而影响后代表型。目前研究者们关于small RNA的研究较多,但是对于哺乳动物中>200nt的long RNAs却知之甚少。由于检测技术灵敏度和二代高通量测序读长的限制,导致spiRNAs的研究非常受限。三代测序因其长度长优势被广泛应用于全长转录本的鉴定,而二代测序由于其高准确性等优势仍被沿用,但尽管结合三代测序和二代测序解决了读长和准确度的问题,目前也难以精确确定长reads的5′和3′边界。在这项研究中,研究者分离出超纯的小鼠精子RNA,使用三代和二代测序包括精巢样本CAGE及PAS-Seq,呈现全面的精子转录组特性,证明精子中存在完整的long RNAs,探索哺乳动物中spiRNAs可能存在的生物学功能。通过对比小鼠和人类精子的RNAs转录组数据研究spiRNA在进化上的保守性和功能性,并为相关医学诊断提供了参考RNAs信息表。此外本研究中所使用的策略和自主开发的生物信息分析流程将为其它组织或器官的完整longRNAs鉴定提供参考。
材料和方法
该研究以小鼠和人类精子为材料,分离超纯的精子RNA,进行Pacbio Iso-Seq和Illumina转录组链特异性文库测序,数据用于后续分析。共获得256,897个PacBio Iso-Seq long reads,测序深度达到饱和。同时使用ONT cDNA全长转录组测序分析鉴定精子全长转录本,验证并丰富转录组组装结果。此外,使用来自精巢的CAGE and PAS的数据校正精子中的完整转录本,多种类型文库和平台测序数据结合分析,为小鼠精子提供了一个高质量参考转录组(图1)。
主要研究结果
1.小鼠精子中存在完整的long RNAs且与精巢中的有明显不同
 
本研究证实了小鼠精子存在完整的 long RNA,共检测到了来自1,624个基因位点的3,440 种spiRNA ,其中有755种spiRNA和参考序列中已报道过的完全相同,198种spiRNA的基因位点是全新的,7种spiRNA是已知基因位点的反义链(图2a),2479种为已注释位点的新转录本(图2b),研究发现这些新转录本大多由APAs作用产生而来,只有少部分是由可变剪切和选择性转录起始产生(图2c)。此外检测到了1个跨越两个邻近基因的spiRNA(图2d)。与精巢中的完整转录本不同,spiRNA 长度更短(963nt)且有特异性功能富集,基于GO富集分析,spiRNA最显著富集之一的是编码80S核糖体的mRNAs(图4a),而这在精子成熟过程中是不需要的,说明spiRNAs具有组织特异性。

图2:精子中存在完整的long RNA转录本.

2. spiRNAs包含mRNAs和lncRNAs

为了验证spiRNAs在精子发生发生过程中的编码潜力,研究者们结合已有的Ribo-Seq数据库分析后,将小鼠的spiRNAs分成了2343个mRNAs和1097个lncRNAs,RPFs(ribosome protected fragments)在spi-mRNAs的编码区富集(图3a),并且发现在spi-mRNAs上富集的RPFs呈现出了三核苷酸的周期性 (three-nucleotide periodicity)(图3b)。此外该研究还验证了新转录本的潜在编码功能,来自已知位点的共2479个新isoforms中有1538个被注释为mRNAs, RPFs也分布在新的外显子序列中(图3c),这说明spi-mRNAs中的RPFs是可以进行翻译的。而对于来自新位点的198个新转录本,研究者们观察到78个已经注释的mRNAs和120个lncRNAs(图3d,e)之间存在明显差异,这种现象和全转录本中相似(图3a,b)。

图3 spiRNAs include both mRNAs and lncRNAs
3.小鼠与人类之间的spiRNA profile在进化上是保守的
为了检测spiRNA在进化上的保守性,研究者们同时还对人类精子RNA进行了测序 (图5),分析后共检测到2205个基因位点中的4,100 spiRNAs ,包括3517个mRNAs和583个lncRNAs。对比发现小鼠和人类共有562个spiRNAs相同(图4c)。以所有人类spiRNA genes 作为背景进行GO富集分析,结果显示编码蛋白质合成的mRNAs得到了富集(图4d),与在小鼠精子中的发现一致(图4a)。研究者们进一步分析了非核糖体mRNAs,发现小鼠和人类依然存在明显的重叠。说明可能存在一种保守机制决定spiRNAs序列库。

 
图4  The spiRNA profile is evolutionarily conserved
 
 图5 Diverse transcripts in human sperm
总结与讨论

这项研究证明了精子中存在完整的 long RNAs,并在编码核糖体蛋白功能中显示富集,其功能与精巢中的RNAs不同,说明其具有一定的组织特异性。而另外发现的spiRNA在小鼠和人类中具有保守性,说明可能存在一种潜在的保守机制决定着spiRNAs序列库。

总之,该研究结合自助开发的研究策略和生物信息分析流程,揭示精子细胞中的完整RNA图谱,推动了RNA介导的表观遗传学研究,并为该领域进一步的研究提供了宝贵资源。

0 回复

发表评论

想参加讨论吗?
请尽情讨论吧!

发表评论

邮箱地址不会被公开。 必填项已用*标注