新品∣未来组三代群体基因组SV:ONT P48一出,谁与争锋?
新风潮:以ONT PromethION为平台的三代群体SV研究目的与意义
现有研究表明单一的一个参考基因组不能反映整个物种的全部多样性,而群体SV检测则可以提供更多的生物标记来描述群体特征;选择合适的群体与表型,科学家们能识别并验证与农艺性状和表型性状相关的SVs,填补由于短读长技术局限造成的功能SV研究空白。
将三代测序技术应用于群体研究始于2018年,三代测序研究先锋Michael Schatz团队利用Nanopore PromethION测序平台,实现在100天内测序100个番茄基因组的目标。目前在已完成全基因组测序的12个番茄样本中该团队发现样本之间存在显著差异,每个样品具有25,000-45,000个结构变异,大多数为插入和缺失,鉴定出先前使用短读长测序所遗漏的数千种SVs。研究表明[1]SV影响植物的抗病、花期、株高、环境适应等许多重要性状,群体的结构变异分析对优良品种选育、差异性状研究等具有重要意义(表2)。玉米基因组中已经发现了大量的农艺性状受CNV控制,从生物、非生物胁迫响应到株型和杂种优势。水稻是研究基因组SV对性状影响的模式物种之一,迄今已经发现超过2000个注释基因受CNV影响。最近在番茄[2]中发现包含ej2W位点的83kb大片段串联重复,抑制ej2W对产量的负面影响。这些案例都表明了染色体结构变异尤其是基因拷贝数的变异,在动植物的育种过程中的重要应用价值。
表1 SV对不同作物品种的农艺性状具有明显影响[1]
ONT P48平台在 SV calling方面的独特优势
图1 短读长的错误映射导致SV检测的系统性误差[3]
图2 ONT不同覆盖度下的SV检出率和准确性[3]
另一方面,相比其他长读长平台,ONT PromethION 48(P48)在reads长度、群体SV研究周期和应用范围上存在明显优势。
ONT P48的平均read N50长度在25-40kb,而Ultra-Long Reads的建库方法其reads N50长度甚至可达50-100kb,从而使得ONT P48在重复区域有更高的比对能力,能够覆盖更多的完整SV,提升对大片段SV(>10kb)和稀有SV检测的敏感性(图3)
图3长read能够分裂对齐(A)或跨越(B)完整的结构变异[4]
其他长读长测序平台需要多个cell才能达到SV calling所需要的数据量,无法满足群体基因组同时测序多个动植物基因组样本的要求。而 ONT PromethION 48(P48)在群体基因组研究上存在明显的周期优势,P48能最多同时并行多达48个样本,且单Cell产量能达到大部分物种30×的数据量需求,极大压缩了群体测序所需时间,在群体测序周期方面有明显优势。
P48对大片段SV(>10kb)SV和稀有SV检测的敏感性,加上可承担的群体测序周期,使其对群体SV检测的应用范围更广,能够完美应对大群体、复杂基因组样本的SV检测。
表2 不同平台性能及SV检测效果比较
ONT P48三代群体SV应用范围
应用群体
玉米、水稻、番茄、油菜等主要农作物的遗传群体或自然群体;猪、牛、羊等重要家畜遗传群体;人类(遗传疾病及癌症研究)。
应用方向
挖掘全新、稀有、大尺度结构变异;与重要农艺性状相关联的SVs功能研究;基于SV尺度的群体进化研究等。
群体大小
动物样本数≥5,植物样本数≥10。
15×左右,根据实际群体大小和样本情况最终确定。
三代群体SV生信分析基本内容
ONT P48 三代群体SV活动内容
夏天正是万物繁茂的时候,基因组群体SV研究正当时。借本次武汉未来组P48机器服务首发的机会,未来组现全新推出ONT P48三代群体SV暑期特惠活动(已签单旧项目不在本次活动范围内),活动内容如下:
*组装样本基因组不超过4Gb,且不承诺组装指标。
活动价格请联系 153 8703 7487(未来组营销中心) 或者请直接联系未来组当地销售人员
活动邮箱:support@nextomics.org
本次活动最终解释权归武汉未来组所有
[1]I. Gabur, H. S. Chawla, R. J. Snowdon, and I. A. P. Parkin, “Connecting genome structural variation with complex traits in crop plants,” Theor Appl Genet, vol. 132, no. 3, pp. 733–750, Mar. 2019.
[2]S. Soyk et al., “Duplication of a domestication locus neutralized a cryptic variant that caused a breeding barrier in tomato,” Nat. Plants, vol. 5, no. 5, pp. 471–479, May 2019.
[3]F. J. Sedlazeck et al., “Accurate detection of complex structural variations using single molecule sequencing,” Bioinformatics, preprint, Jul. 2017.
[4]W. De Coster and C. Van Broeckhoven, “Newest Methods for Detecting Structural Variations,” Trends in Biotechnology, p. S0167779919300368, Mar. 2019.
[5]Wang, Wensheng, et al. “Genomic variation in 3,010 diverse accessions of Asian cultivated rice.”Nature 557.7703 (2018): 43.
发表评论
想参加讨论吗?请尽情讨论吧!