MBE |华中农业大学和崖州湾国家实验室联合多家国内外单位从泛基因组水平解析SV对世界牛品种选育提高的关键作用

牛作为全球重要的家畜物种,在满足高品质肉类需求、环境生态平衡及民族稳定方面发挥重要作用。但在牛基因组育种中,长期依赖单一个体基因组为参考开展工作,严重限制了牛重要经济性状解析和应用,并且之前的研究多仅从SNP的角度开展分析,这导致牛基因组上许多重要的遗传信息功能处于未知状态。泛基因组是一个物种所有基因组信息的集合,以其为参考可以更加完整有效的解释牛经济性状的多样性。SV是基因组上长度在50bp到5Mb的大片段序列变异,被认为是造成个体间基因组差异和泛基因组多样性的重要因素,也是从泛基因组水平解析变异和表型之间调控关系的重要媒介。

2025年8月19日,华中农业大学和崖州湾国家实验室联合美国农业部科技局、丹麦奥胡斯大学、浙江大学海南研究院、西北农林科技大学、吉林农业大学等多家国内外单位在Molecular Biology and Evolution (MBE, IF5年=11.9)杂志上发表题为“Global pangenome analysis highlights the critical role of structural variants in cattle improvement and identifies a unique event as a novel enhancer in IGFBP7⁺ cells”的论文。该论文从泛基因组水平对世界~2400头牛82个品种的SNP和SV变异同时开展检测,构建了目前最大的牛泛基因组SNP+SV变异图集和填充参考面板,通过多组学整合分析和多方验证凸显了 SV 在塑造遗传多样性中的独特且不可替代的作用,为适应、选育及牛群改良策略提供了全新见解。
 
01
图形泛基因组构建和基因组变异检测
 

本研究收集了82个品种2409头牛的WGS数据集,侧重全球主要血统的多样性,并补充了以往研究代表性不足的种群。根据牛的地理起源和分类,这些牛可分为13个不同的种群,并且这些牛在经济表型(如产奶量、体重、体高)和气候适应性方面表现出实质性的差异,代表了全球牛种群广泛的遗传多样性。

所有样本首先以ARS-UCD1.2作为参考基因组,鉴定出28,088,254个SNP(MAF≥0.01)。然后通过整合23个牛基因组和92,518个先前报道的SVs构建了牛的图形泛基因组,并以此为参考基因组,鉴定出152,199个SVs,其中包括75,774个新的SVs。与参考基因组相比,新得到24.51Mb的序列。

图1 泛基因组构建和变异检测分析流程图

 
02
SV与SNP一样能有效解析牛种群结构
 
为了阐明牛种群之间的进化关系,本研究分别基于SNP和SV开展了PCA、聚类分析、admixture分析和基因漂变分析,并对结果进行了两者的比较,发现除admixture分析获得的结果存在一些差异外,其他分析的群体分类结论高度一致。在admixture分析中,当 K=6 时,尽管 SV 没有像 SNP 那样把西欧与中南欧的普通牛分开,但它们仍能准确描绘其它牛品种的关系,识别出欧洲的普通牛、东北亚的普通牛、非洲的普通牛,以及华北和非洲的瘤牛。无论基于 SNP 还是 SV 的基因漂变分析均显示,中国和非洲的牛群均受到欧洲牛的影响,同时各自区域内部也存在基因流动。

图2 基于SNP和SV开展admixture分析

03
基于SNP的欧洲牛选择信号可指导未经选育的牛群基因组改良
 

数百年来,欧洲改良牛品种针对产肉与产奶性能进行了系统而定向的选育,与欧洲其它普通牛相比,这些改良品种在 SNP 和 SV 水平均表现出更慢的连锁不平衡(LD)衰减,并拥有更长的纯合片段(ROH)。根据育种方向与体型大小,将牛群分为奶牛、中小型肉牛、大型肉牛三类,基于SNP 数据,结合 Fst、XP-CLR与 XP-EHH 三种方法,在上述三类群体间共鉴定出 223、237、223 和 273 个互不重叠的受选择区段。将这些区段的染色体位置与公共数据库中的牛 QTL比对后发现:奶牛与所有肉牛的比较中,显著窗口富集乳成分相关 QTL,而两类肉牛之间的比较中,则富集肉用与胴体性状 QTL。

用欧洲肉牛与奶牛间 Fst 分析的前 1% SNP 做 PCA 时,PC1 轴上中国与非洲牛均位于欧洲肉牛与奶牛之间。这提示中、非牛群尚未经历针对乳用或肉用的定向选育,即其控制产肉、产奶的关键变异尚未受到选择压力。例如,位于 SLC24A2(chr8:24 555 356,奶牛钙通道活性)、ASIP(chr13:63 667 387,中小型肉牛脂肪沉积)、MYL6(chr5:57 162 869)及 MYL6B(chr5:57 161 801,大型肉牛肌肉发育)的 SNP,在中、非牛群中的等位基因频率均与欧洲选育群体处于相反极端。这意味着欧洲改良肉牛/奶牛的候选选择信号可为中国与非洲牛的定向育种提供靶点。

图3 肉牛和奶牛SNP选择信号鉴定

04
近期的SV突变为欧洲肉牛与奶牛的改良提供了超越 SNP 的遗传变异来源
 

通过对欧洲改良肉牛与奶牛群体间所有比较采用前 1% 阈值的 FST 统计,共检测到2,423 个受选择的 SV 信号。值得注意的是,SV 所揭示的基因中,有 32.80% 至 60.12% 在使用相同阈值的 SNP 分析中未被捕获;与此同时,约 95% 的受选择 SNP 信号也无法被 SV 标记。例如,SNP 检测到的 ASIP、MYL6 和 MYL6B 等基因在 SV 层面并未被发现。尽管如此,受选择 SV 所影响的注释基因在功能上同样富集于与候选 SNP 相似的通路。显著受选择的 SV 区域同样富集于与产奶量及肉用、胴体性状相关的 QTL。这证实了 SV 与 SNP 同等重要,并且能够解释 SNP 无法单独捕捉的表型变异。

此外,本研究将那些距离 ≤1 Mb 且与任何 SNP 的 r²<0.6 的SV 定义为“孤立 SV”(orphan SV),而能被至少一个 SNP 标记(r²≥0.6)的SV占比仅59.86%。在区分奶牛与所有肉牛的受选择 SV 信号中,观察到一处排名最高的孤立 SV(chr2:56,290,045–56,298,615),位于 LRP1B 基因(低密度脂蛋白相关蛋白 1B,已被确定为影响乳脂沉积的候选基因)的内含子区域。该孤立 SV 为一个完整的 L1_BT 序列(超过一半受选择 SV 与基因组中的移动元件插入(MEI)重叠,牛特异性的 MEI——包括L1_BT(43.51%)、BovB(13.25%)和 BovA2(10.32%)——是构成受选择 SV 信号的主要来源),这一 SV 插入仅见于普通牛(taurine)。群体变异分析进一步提示,该 L1_BT 插入可能发生在欧洲普通牛与其他普通牛群体分化之后。混合模型分析显示,中国西北普通牛及华中杂交牛在该位点的 SV 变异可能源自欧洲普通牛的基因渗入。因此,推测这一孤立 SV 代表了近期在欧洲普通牛群体中发生的 L1_BT 插入事件,引入了能够调控 LRP1B 表达的功能元件,从而影响乳脂沉积。在随后的选择过程中,该突变在奶牛与肉牛间发生了分化。

图 4 受选择SV信号的筛选

05
SNP 与 SV 的受选择信号共同解析了欧洲牛引入热带地区后所面临的适应性挑战

欧洲牛在输入华南和非洲时,首要挑战是环境适应性——包括对高温与疾病的耐受力。通过选择信号扫描分析,在欧洲普通牛与华南/非洲瘤牛之间共发现 25 743 个SNP和 2 081 个 SV呈现显著受选择,共有 30 个基因被显著受选择的 SNP 与 SV 同时注释。比较了与基因重叠的全部 SNP 与 SV 的 FST 值,发现 30 个受选择基因中有 7 个的最高 FST 值由 SV 贡献;其中 4 个基因(BBS9、ABHD12、CD300A、GHR)的 SV 直接改变了功能元件的序列结构,包括预备增强子、活性元件、活性转录起始位点及多梳抑制区。为验证这 4 个受选择 SV 是否影响基因表达,通过比较 CattleGTEx 中 7 105 头普通牛与 490 头瘤牛在 8 种不同组织中的基因表达水平,发现这 4 个基因在普通牛与瘤牛的多组织间均存在广泛差异表达,提示某些 SV 在受选择区段可能起主导作用。

非洲普通牛能够在炎热潮湿环境中繁衍生息,可能源于趋同进化,并得益于与瘤牛的杂交。在非洲普通牛与其他普通牛之间共有的 926 个强选择(FST > 0.3)SV 信号中,许多 SV 在非洲普通牛与非洲瘤牛之间频率相似,却与其他普通牛差异显著。值得注意的是,这些选择信号中的孤立 SV 在非洲普通牛中多呈中等频率,而在其他牛群中频率极低甚至缺失。此外,这些孤立 SV还覆盖了与耐热/耐寒、抗病/免疫等功能相关的基因,为其适应当地环境提供了有利帮助。

 图5 非洲普通牛 vs. 欧洲普通牛,以及非洲瘤牛 vs. 欧洲普通牛的 SV 选择信号曼哈顿图

06
SV 在调控 IGFBP7⁺ 脂肪细胞生成中发挥主导作用

在本研究中,有一个 SV(chr6:72,419,812–72,422,015)在欧洲改良牛及多个地域牛群中均呈显著受选择状态:其在中小型肉牛(MS beef)中的出现频率显著高于脂肪沉积能力较低的大型肉牛和奶牛,并且随着牛群分布由寒带向热带推进,其出现频率逐渐降低。该 SV 位于脂质积累关键基因 IGFBP7 的第一个内含子,其选择特征与中小型肉牛的能量代谢性状及耐寒/耐热适应性高度一致。进一步利用 PCR 和 IGV 软件验证了 这个SV 的存在,序列比对显示其为一段高度分化的 L1_BT 部分序列。MEME 扫描发现 SV 序列包含多个基序,其中 GGRRGAGGGAG 基序显著富集于参与糖脂代谢和生长因子活性的转录因子。

为探究其功能,本研究从不同SV 基因型牛只分离原代脂肪细胞并进行单细胞 RNA 测序,发现一个小细胞簇(Cluster 18)特异性高表达 IGFBP7。双荧光素酶报告实验证实该 SV 序列具有显著增强子活性。进一步比较发现,SV(-) 牛只 Cluster 18 细胞中的 IGFBP7 表达水平显著低于 SV(+) 牛只,提示该 SV 作为增强子调控 Cluster 18 细胞中的 IGFBP7 表达。

IGFBP7 是一种分泌蛋白,可通过结合细胞膜受体调控邻近细胞。具体而言,IGFBP7 能与 IGF-1 受体结合并阻断胰岛素样生长因子的激活。IGFBP7⁺细胞与其他细胞类型间的差异表达基因显著富集于生物调控、细胞过程调控、刺激应答及细胞通讯等通路。既往研究亦表明某些基质细胞群可调控脂肪生成,支持 IGFBP7⁺细胞可能作为调控细胞的假设。诱导成脂实验显示,SV(-) 牛只脂肪组织分离的原代脂肪细胞脂质积累能力显著高于 SV(+) 牛只。因此,本研究提出如下机制假设:该 SV 作为增强子上调 Cluster 18 细胞中的 IGFBP7 表达,促使 IGFBP7 分泌至细胞外基质;分泌型 IGFBP7 通过与 IGF1R 受体相互作用调控脂质积累,可能经由影响葡萄糖摄取实现。

图6 IGFBP7 位点 SV 的功能分析及其调控脂肪沉积的潜在机制

总结与亮点
• 对比分析证明了SV不仅可以像SNP一样有效的解释世界牛品种的群体结构,还能独立调控重要经济性状,近40%的SV不能被SNP标记,暗示其可能会揭示SNP不能定位的经济性状相关基因和无法解释的重要机制。• 通过解析欧洲培育专门化牛品种与经济性状相关的变异位点/基因及其对我国和非洲本土牛品种选育的指导作用,发现了大量与牛经济性状相关,但不能被SNP标记的重要候选SV位点及其靶基因。• 证明了SNP和SV可以共同解释世界不同地域牛品种的表型和适应性差异,重点分析了当欧洲培育品种牛引进到我国及非洲优秀种源稀缺地区所面临的与适应性相关基因组遗传信息。

• 针对与欧洲牛选育和适应性同时相关的SV展开分析,揭示了该SV序列可以作为增强子调控IGFBP7表达影响能量代谢的机制,明确了该SV位点在欧洲牛定向选育和世界牛品种地域适应性中发挥的重要作用,为我国牛基因组育种提供了重要的候选靶标。

该论文突出了SV相较SNP独立对世界牛品种经济性状形成和适应性的重要调控作用,率先提出了“Orphan SV”的概念,为我国牛基因组育种提供了重要的候选变异位点/基因数据集,对重拾丢失遗传力,实现精准高效育种具有重要意义。

全文链接如下:https://academic.oup.com/mbe/advance-article-abstract/doi/10.1093/molbev/msaf205/8238201?utm_source=advanceaccess&utm_campaign=mbe&utm_medium=email 

华中农业大学博士研究生戴守露、浙江大学海南研究院赵鹏举副研究员、华中农业大学毕业硕士李文浩、崖州湾国家实验室博士研究生彭玲伟为论文共同第一作者;华中农业大学/崖州湾国家实验室周扬、美国农业部George Liu、丹麦奥胡斯大学房灵昭为论文共同通讯作者,华中农业大学杨利国教授、吉林农业大学/崖州湾国家实验室吕文发教授、西北农林科技大学蓝贤勇教授为本项工作开展提供了重要支持和帮助。该项研究受国家STI2030、国家自然科学基金、湖北省支持种业高质量发展项目及崖州湾国家实验室项目支持。