科研速递 | Nanopore测序深入研究重复扩张和甲基化变异相关疾病

短串联重复序列(Short Tandem Repeats, STRs)的扩张已被证实与许多神经系统疾病或其他病症密切相关,但对这一遗传变异进行分子鉴定仍然存在很大的挑战。近日,来自德国柏林的研究团队于bioRxiv上发表了题为“Repeat expansion and methylation state analysis with nanopore sequencing”的文章,为大家介绍了一种基于Nanopore测序的Cas12a-based富集策略,并结合一种全新的原始信号分析算法,能有效提高对STRs序列的靶向效率、测序精度,同时还能准确计算重复的个数并检测其甲基化状态等重要信息,从而为研究动态突变疾病的分子机理提供了强有力的三代测序分析工具。

目前,已知至少有30多种人类孟德尔疾病与基因组不稳定的STRs扩张有关,例如C9orf72基因的GGGGCC-repeat [(G4C2)n]的扩张是额颞叶型失智症(Frontotemporal Dementia,FTD;OMIM: # 600274)和肌萎缩侧索硬化症(Amyotrophic Lateral Sclerosis,ALS;c9FTD/ALS;OMIM: # 105550)最常见的单基因致病机制;FMR1基因中的CGG-motif积累也解释了脆性X染色体综合征(Fragile X Syndrome,FXS;OMIM: # 300624)的分子机制。另外,也有越来越多的证据表明个体之间和个体内部的重复序列的可变性,以及重复序列所在的基因组区域的DNA甲基化修饰等都同样影响着疾病的表型。

部分STRs与疾病列表

由于二代测序技术的短读长、GC偏好性、难拼接等固有限制,无法快速、高效、精确地鉴定STRs,因此STRs的研究一直无法开展,同时也大大制约了对更多疾病的深入研究和精准诊断。为了克服这个关键的技术瓶颈,研究团队围绕以下几点进行逐个击破。

  • 采用Nanopore测序,优化Nanopore的信号分析及STRs捕获流程(图1)
  • 开发目标富集策略,提高检测效率(图2)
  •  整合重复序列扩张以及DNA甲基化的检测手段

简要介绍

图1 nanoSTRique:在Nanopore原始信号基础上的重复序列检测pipeline

作者团队首先构建不同长度的(G4C2)n-repeat质粒对已有的算法进行检验,发现当(G4C2)n-repeat重复次数超过32之后,结果变得不可信。于是为了提高对于重复序列的分析,作者团队开发了一种对Nanopore原始测序信号的分析算法——nanoSTRique(nanopore Short Tandem Repeat identification quantification & evaluation,图1a)。简单来说,就是通过将base-called sequences比对到参考基因组,从而获取那些跨越了STR区域的reads。然后nanoSTRique依据SeqAn2算法精确鉴定每一个重复的上下游边界。最后,通过Hidden Markov Model准确计算STR序列的重复数目。

图2 基于CRISPR-Cas12a的目标区域富集及Nanopore测序策略

作者团队还利用CRISPR-Cas12a-核糖核蛋白(CRISPR-Cas12a-ribonucleoprotein,Cas12a-RNP)系统进一步提高了对STR区域的覆盖度。同时优化了多项处理流程,例如,在Cas12a-RNP酶切之前增加了对所有5’端进行去磷酸化处理,从而减少了“背景”片段连上测序接头,保证只有被Cas12a-RNP酶切的片段才能被测序等。

最后,结合nanopolish和nanoSTRique的结果,可以综合分析Nanopore测序中的甲基化修饰信息。

本研究展现了第三代测序技术在精确、全面分析致病性STRs方面的强大能力,并且通过优化的建库策略,可以做到无需PCR扩增达到对目标区域的富集,避免了引入PCR扩增所带来的偏好性错误和甲基化信息的丢失,实现对DNA分子的全方位实时记录,为进一步综合挖掘和分析与人类健康息息相关的“基因组暗物质”,以及与发育、分化、衰老相关的实时甲基化变化的研究提供了可靠的检测手段。

2017年7月希望组团队在Genome Medicine杂志发表题为“Interrogating the‘unsequenceable’genomic trinucleotide repeat disorders by long-read sequencing”的文章,发布了一种称为RepeatHMM的新型算法,专门针对第三代长读长测序技术,精准分析测序数据,实现对基因区域重复序列单元进行准确计数,帮助研究人员更深入揭秘串联重复疾病的致病分子机制,并为临床诊断、风险评估和预后提供可靠证据。同时,希望组团队于2018年7月份在Molecular Cell上发表了“N6-Methyladenine DNA Modification in Human Genome”文章,应用三代测序技术首次获得了中国人DNA N6-甲基腺嘌呤(6mA)修饰图谱,是人类基因组DNA甲基化研究领域的重大突破。

0 回复

发表评论

想参加讨论吗?
请尽情讨论吧!

发表评论

电子邮件地址不会被公开。 必填项已用*标注