参考级基因组如何组装?野生大豆告诉你

有效追踪基因组变异、映射重要数量性状位点(QTLs)、发现新的等位基因需要一系列的遗传资源信息,而野生种质是最重要的遗传资源。尽管目前已有大豆品种的参考基因组发表,然而这些对于解决有关大结构变异或复杂基因组重排分析等问题还远远不够。香港中文大学生命科学学院大豆研究中心林汉明教授团队联合多家单位,应用PacBio、Bionano 及Hi-C等多种技术手段,获取了高质量的参考基因组级别的野生大豆W05基因组,为大豆种质资源研究及育种改良奠定了基因组学基础,研究成果于近日发表于Nature Communications。

Fig.1野生大豆与栽培大豆种子

方法与结果

基因组组装
研究者对野生大豆W05的组装给出了详细的组装流程(Fig.2)。研究者使用PacBio测序数据进行校正及初步de novo组装,随后采用Illumina数据进行polishing。Bionano双酶切数据辅助构建scaffold,Hi-C数据的加入使序列定位到染色体上,构建superscaffolds。最终组装获得的基因组大小为1013.2Mb,contig N50 3.3Mb,scaffold N50 50.7Mb。

Fig.2野生大豆基因组de novo组装流程

基因组注释
研究者分别对不同生长时期及发育阶段的野生大豆样本进行RNA-Seq和PacBio Iso-Seq测序,并结合RNA-Seq/ Iso-Seq转录组数据,使用同源蛋白预测及从头预测等方法对蛋白质编码基因和可变剪接异构体进行注释。注释获得55,539个蛋白编码基因,对应89,477个蛋白质编码转录本。此外,在W05基因组中,还发现了288个miRNA,1,988个snRNA及147 个rRNA(Table 1)。

种皮颜色的遗传变异
为了鉴定驯化过程中引起种皮颜色变化的遗传变异,研究者将W05基因组与Wm82及ZH13基因组进行比较分析。分析结果显示,Wm82和ZH13紧邻CHS基因簇的位置都发生了复杂的染色体重排,包括倒位及重复;与W05相比,Wm82的I locus 区发生了复杂的倒位现象,这与大豆种皮颜色的转变有关(Fig.3)。

Fig.3控制大豆种皮色素沉着的结构变异

与栽培种的结构差异分析

转座元件(TEs)是一种重复的DNA序列,是植物基因组的重要组成部分,是自然选择和人工选择的重要变异源。基于同源分析和从头预测,研究者发现W05基因组中53.9%的序列为重复元件,其中最主要的重复类型为LTR。通过将基因组进行比较分析,研究者在W05、Wm82_v2和ZH13中分别鉴定出了~2300–3000个TE插入事件。其中,W05基因组中分别发现了419和400个有别于Wm82_v2 和 ZH13的转座插入事件。

高质量的基因组使精确的结构变异比较分析成为可能。研究者通过比较分析发现,与W05相比,Wm 82_v2和ZH13分别有32个和12个大的结构变异,其中最大的结构变异为发生在11号和13号染色体上的染色体间相互易位。研究者还发现控制蔓生长、单株种子数和单株荚数的QTL位点位于易位区。

Fig.4 I locus区种皮色素沉着的倒位现象

此外,研究者还利用光学图谱(OM)数据对发现的结构变异与其他的大豆品种进行比较分析及验证。对I locus 区的比较分析表明,有色种皮的大豆如W05在该区域未发生倒位。而浅色种皮的Wm 82和ZH13具有相同的倒位现象(Fig.4)。

野生种质的高质量参考基因组提高了复杂基因组群体遗传分析的精度。在本研究中,研究者展示了W05参考基因组在遗传变异分析、比较基因组和进化研究中的重要作用,例如大结构变异的鉴定、QTL、基因和等位基因的识别。同时还强调了高质量参考基因组与光学作图技术相结合在研究多个种质结构变异中的优势。

参考文献:Xie, M. et al. A reference-grade wild soybean genome. Nature Communications 10, 1216 (2019).

0 回复

发表评论

想参加讨论吗?
请尽情讨论吧!

发表评论

邮箱地址不会被公开。 必填项已用*标注