产品介绍
DNA甲基化是一种常见的表观遗传修饰,是基因表达调控中一种常见而又重要的机制,参与细胞分化与增殖、生物体老化、肿瘤发生等多种重要生命活动,在调控基因组印记、X染色体失活、转座子抑制、表观遗传“记忆”维持和肿瘤发生等生命过程中起重要作用,是目前研究热点之一。
Oxford Nanopore测序是一种单分子,实时测序的测序方法,其以单分子DNA(RNA)通过生物纳米孔的电流变化推测碱基组成而进行测序,ATCG四种碱基以及带有甲基化修饰的碱基的带电性质不同,因此通过电信号差异特征即可检测出通过纳米孔的碱基类型,从而实现甲基化修饰的检测。
产品优势
目前DNA表观修饰检测方法主要有两种:重亚硫酸盐转化测序法和免疫沉淀测序法。重亚硫酸盐转化测序法将未甲基化的胞嘧啶转化为尿嘧啶后通过二代测序进行检测,但是其转化效率受限以及短读取测序对于基因组重复区域不能准确鉴定;免疫沉淀测序法能够检测DNA或RNA甲基化修饰,但达不到单碱基分辨率。新兴的第三代测序技术(PacBio SMRT和Nanopore测序)能够直接检测DNA甲基化修饰:PacBio SMRT测序通过荧光信号时间延迟效应检测DNA修饰,其检测准确度依赖于较高的覆盖度,高额的测序成本严重制约了其应用于表观修饰检测。
Nanopore测序的电信号对碱基修饰比较敏感,而且其测序成本低廉。基于Nanopore平台同时检测全基因组范围单碱基的5mC和6mA修饰位点,获得相关材料遗传物质的表观修饰信息,为物种表达调控模式研究提供新的方法,同时,甲基化数据的序列信息还可以用于重测序分析,一套数据分析5mC&6mA的甲基化的同时还能进行结构变异检测。
分析内容
- 原始数据质控
- 参考序列比对分析
- 不同类别碱基修饰位点检测
- 差异甲基化区域分析
案例解析
案例解析
纳米孔测序检测DNA甲基化新算法,准确率达99%
费城儿童医院王凯教授团队、中山大学中山眼科中心肖传乐教授团队和北京希望组公司团队在Nature Communications杂志上联合发表题为“Detection of DNA base modifications by deep recurrent neural network on Oxford Nanopore sequencing data”的研究论文,建立了识别Nanopore表观修饰的深度循环神经网络模型,并开发了相应的软件DeepMod。
深度循环神经网络广泛应用于人工智能领域,如手写识别、语音识别等序列特征建模。研究者采用LSTM-RNN深度循环神经网络作为深度学习框架(图1),采取两种独立的策略利用多个Nanopore测序数据集进行训练和校正,完成了5mC和6mA检测模型的建立。
图1. DeepMod流程图
随后,研究者利用建立好的模型对大肠杆菌和人NA12878数据集的5mC修饰进行预测,检测平均精度高达99%,达到全基因组单碱基分辨率(图2)。接着,NA12878的1-10号染色体被用于训练模型,利用该模型对人HX1和大肠杆菌数据集进行预测,同样展示出精确的5mC预测结果,表明基于某一物种进行训练的DeepMod具有跨物种表观修饰检测能力。最后,利用大肠杆菌和莱茵衣藻数据集对6mA模型进行评估,表现出将近90%的预测精度和跨物种预测能力(图3)。
图2. DeepMod对大肠杆菌5mC预测性能的评价
图3. DeepMod对大肠杆菌6mA预测性能的评价
综上所述,该研究为Nanopore应用于表观修饰领域提供了重要的软件工具—DeepMod。首次将5mC的准确率提高到99%,实现了5mC的精准检测;首次建立了原核和真核通用6mA和5mC检测方法;并建立了首个Nanopore真核生物6mA修饰标准集。
随着Nanopore测序的发展,包含有表观修饰信息的ONT测序数据飞速增加,DeepMod优异的全基因组水平5mC和6mA检测性能,跨物种通用检测能力,扩展到其他类型DNA修饰的巨大潜力,将为Nanopore测序数据的表观修饰信息挖掘提供重要帮助。