新品∣未来组三代群体基因组SV:ONT P48一出,谁与争锋?

群体遗传学研究的一个重要手段是利用高通量测序技术提供的DNA序列变异信息来推测作用于基因组的各种力量(突变,自然选择,群体结构等)是如何影响生物演化进程的。基于二代测序短读长的群体基因组重测序虽能同时运行多个群体样本的测序,但该技术对大尺度结构变异(Structural Variations,SVs,>50bp)检测存在着先天劣势;而利用其他长读长测序技术进行群体基因组重测序则存在花费昂贵,无法并行运行多个群体样本,群体测序周期较长的缺点。武汉未来组首家引入的ONT PromethION 48(P48)平台将完美解决基于上述平台群体基因组重测序的瓶颈,一次能同时运行48个样本,同时兼具高通量,长读长,且成本优廉的优势,将会成为广大动植物群体基因组科学家的研究新利器。

 

新风潮:以ONT PromethION为平台的三代群体SV研究目的与意义

现有研究表明单一的一个参考基因组不能反映整个物种的全部多样性,而群体SV检测则可以提供更多的生物标记来描述群体特征;选择合适的群体与表型,科学家们能识别并验证与农艺性状和表型性状相关的SVs,填补由于短读长技术局限造成的功能SV研究空白。

将三代测序技术应用于群体研究始于2018年,三代测序研究先锋Michael Schatz团队利用Nanopore PromethION测序平台,实现在100天内测序100个番茄基因组的目标。目前在已完成全基因组测序的12个番茄样本中该团队发现样本之间存在显著差异,每个样品具有25,000-45,000个结构变异,大多数为插入和缺失,鉴定出先前使用短读长测序所遗漏的数千种SVs。研究表明[1]SV影响植物的抗病、花期、株高、环境适应等许多重要性状,群体的结构变异分析对优良品种选育、差异性状研究等具有重要意义(表2)。玉米基因组中已经发现了大量的农艺性状受CNV控制,从生物、非生物胁迫响应到株型和杂种优势。水稻是研究基因组SV对性状影响的模式物种之一,迄今已经发现超过2000个注释基因受CNV影响。最近在番茄[2]中发现包含ej2W位点的83kb大片段串联重复,抑制ej2W对产量的负面影响。这些案例都表明了染色体结构变异尤其是基因拷贝数的变异,在动植物的育种过程中的重要应用价值。

表1 SV对不同作物品种的农艺性状具有明显影响[1]

ONT P48平台在 SV calling方面的独特优势

SV检测最大的难点实际上是read太短导致的,因此二代测序在SV检出率和准确性方面存在先天劣势(图1),短读长对于高重复序列区域无解,据报道[3]短读长测序技术对SV的检出率只有10%-70%,而假阳性率高达89%,并且无法检测复杂或嵌合SV。而基于Oxford Nanopore的长读长测序可以显著提高SV检测的准确性和分辨率。长读长测序检测到的SVs数量是短读长的3-4倍,尤其是在50-1000bp范围内[4],并且可以轻松跨越重复区域,甚至是整个SV区域,因此有更高的置信度来确定断点,只需要10~30× 覆盖度,便可以达到80%左右的检出率和大于80%的准确性(图2)。

图1 短读长的错误映射导致SV检测的系统性误差[3]

图2 ONT不同覆盖度下的SV检出率和准确性[3]

另一方面,相比其他长读长平台,ONT PromethION 48(P48)在reads长度、群体SV研究周期和应用范围上存在明显优势。

ONT P48的平均read N50长度在25-40kb,而Ultra-Long Reads的建库方法其reads N50长度甚至可达50-100kb,从而使得ONT P48在重复区域有更高的比对能力,能够覆盖更多的完整SV,提升对大片段SV(>10kb)和稀有SV检测的敏感性(图3)

图3长read能够分裂对齐(A)或跨越(B)完整的结构变异[4]

其他长读长测序平台需要多个cell才能达到SV calling所需要的数据量,无法满足群体基因组同时测序多个动植物基因组样本的要求。而 ONT PromethION 48(P48)在群体基因组研究上存在明显的周期优势,P48能最多同时并行多达48个样本,且单Cell产量能达到大部分物种30×的数据量需求,极大压缩了群体测序所需时间,在群体测序周期方面有明显优势。

P48对大片段SV(>10kb)SV和稀有SV检测的敏感性,加上可承担的群体测序周期,使其对群体SV检测的应用范围更广,能够完美应对大群体、复杂基因组样本的SV检测。

表2 不同平台性能及SV检测效果比较

ONT P48三代群体SV应用范围

应用群体

玉米、水稻、番茄、油菜等主要农作物的遗传群体或自然群体;猪、牛、羊等重要家畜遗传群体;人类(遗传疾病及癌症研究)。

应用方向

挖掘全新、稀有、大尺度结构变异;与重要农艺性状相关联的SVs功能研究;基于SV尺度的群体进化研究等。

群体大小

动物样本数≥5,植物样本数≥10。

单样本测序深度

15×左右,根据实际群体大小和样本情况最终确定。

三代群体SV生信分析基本内容

ONT P48 三代群体SV活动内容

夏天正是万物繁茂的时候,基因组群体SV研究正当时。借本次武汉未来组P48机器服务首发的机会,未来组现全新推出ONT P48三代群体SV暑期特惠活动(已签单旧项目不在本次活动范围内),活动内容如下:

*组装样本基因组不超过4Gb,且不承诺组装指标。

活动价格请联系 153 8703 7487(未来组营销中心) 或者请直接联系未来组当地销售人员

活动邮箱:support@nextomics.org

本次活动最终解释权归武汉未来组所有

参考文献:

[1]I. Gabur, H. S. Chawla, R. J. Snowdon, and I. A. P. Parkin, “Connecting genome structural variation with complex traits in crop plants,” Theor Appl Genet, vol. 132, no. 3, pp. 733–750, Mar. 2019.

[2]S. Soyk et al., “Duplication of a domestication locus neutralized a cryptic variant that caused a breeding barrier in tomato,” Nat. Plants, vol. 5, no. 5, pp. 471–479, May 2019.

[3]F. J. Sedlazeck et al., “Accurate detection of complex structural variations using single molecule sequencing,” Bioinformatics, preprint, Jul. 2017.

[4]W. De Coster and C. Van Broeckhoven, “Newest Methods for Detecting Structural Variations,” Trends in Biotechnology, p. S0167779919300368, Mar. 2019.

[5]Wang, Wensheng, et al. “Genomic variation in 3,010 diverse accessions of Asian cultivated rice.”Nature 557.7703 (2018): 43.

0 回复

发表评论

想参加讨论吗?
请尽情讨论吧!

发表评论

邮箱地址不会被公开。 必填项已用*标注