Nature项目文章|重磅!韩斌院士团队绘制全球首个”野生-栽培稻精细泛基因组图谱”,破解水稻驯化之谜!

北京时间2025年4月16日,中国科学院分子植物科学卓越创新中心韩斌院士团队在国际权威学术期刊《自然》(Nature)上发表题为“A pangenome reference of wild and cultivated rice(野生和栽培稻精细泛基因组图谱)”的重大研究成果。该研究首次完成了145份亚洲栽培稻及普通野生稻的高精度基因组组装,绘制了迄今为止分辨率最高的“野生稻-栽培稻泛基因组图谱”,系统挖掘了普通野生稻广泛的遗传多样性,并全面解析了亚洲栽培稻各类群的进化及驯化路线。这项研究为水稻基因组辅助育种提供了前所未有的遗传资源,为培育抗病耐逆、适应气候变化的优质水稻品种奠定了坚实的科学基础。希望组参与部分ONT、HiFi及Hi-C测序服务。

研究背景
亚洲栽培稻(Oryza sativa L.)由普通野生稻祖先O. rufipogon驯化而来,是全球最重要的粮食作物之一。面对全球人口增长和环境变化带来的双重挑战,提高水稻产量至关重要。自粳稻和籼稻草图基因组及日本晴参考基因组发布以来,大量研究聚焦于栽培稻的基因组多样性。然而,传统单一参考基因组无法全面代表物种的遗传多样性,可能限制功能基因组学研究。泛基因组研究为解析遗传多样性、物种进化及品种改良提供了新视角。然而,当前泛基因组研究主要集中于栽培群体,对野生资源(尤其是O. rufipogon)的探索仍不足,而遗传和地理多样性丰富的O. rufipogon是改良现代水稻抗逆性和竞争性的关键基因库,因此,构建高质量、大规模的野生稻泛基因组对指导育种策略和解析驯化路径具有重要意义。
研究内容
01  149个水稻基因组的从头组装
为了全面捕捉栽培稻和野生稻的固有遗传多样性,该研究选取了149份代表性样本,其中包含145份具有地理和遗传多样性的材料(包含129份普通野生稻O. rufipogon和16份栽培稻O. sativa)(图1),以及重新鉴定的4份野生稻材料作为后续进化研究的外群。采用PacBio HiFi和ONT技术进行深度测序,通过多种策略对原始数据进行精细组装,获得的高质量基因组平均 N50为14.95 Mb,LAI指数为24.13,BUSCO完整性达98.55%。值得注意的是,将组装的基因组与以往研究及T2T组装基因组比较结果表明本研究的测序和组装方法的精确性。

此外,该研究结合Hi-C数据获得30个代表性物种染色体级别组装,与参考基因组共线性验证显示高度一致性,根据端粒重复序列,在每个基因组中平均检测到19个端粒。为更全面表征序列多样性,研究从133个HiFi基因组中捕获到替代组装(a-contig)序列。这些替代组装序列包含了主组装(p-contigs)中缺失的杂合信息。值得注意的是,栽培稻中替代组装序列的规模显著小于野生稻,反映了前者较低的杂合率。这些发现为理解驯化过程中基因组稳定性演变提供了新视角。也强调了在育种中利用野生稻杂合基因组资源的重要性。

02 基因注释与抗病基因分析
该研究对每个基因组进行了基因注释,平均注释到40,273个蛋白质编码基因。野生稻的基因组大小和基因数量均高于栽培稻,但其基因密度较低。在HiFi基因组组装中,通过对替代组装(a-contig)进行注释,鉴定出199至41,230个基因,其中获得了10,521个主组装(p-contigs)缺失基因(MIP genes)(图1)。此外发现替代组装其中57.26%为杂合等位基因,这些基因在根系、叶片等组织中呈现差异表达。

由于长期自然选择,野生稻对生物和非生物胁迫具有高度抗性,是天然的抗性等位基因库。因此,通过对野生稻与栽培稻中抗病基因类似物(RGAs)进行分析,研究发现野生稻含有1,710个抗性基因类似物(RGAs),显著高于栽培稻的1,652个。进一步通过共线性分析发现野生稻中具有638个特有RGA位点,其中包括一个野生稻RLK基因LOC_Os07g35680,该基因近期被报道为OsMADS26介导的稻瘟病负调控因子。另外在野生稻中鉴定出多个携带稻瘟病抗性基因Pi5的材料。这些结果表明,野生稻蕴含丰富的抗病资源,可作为培育高抗水稻品种的供体材料。

03 泛基因组构建与TE进化分析
该研究整合具有代表性的129份普通野生稻和16份亚洲栽培稻,构建了一个野生稻-栽培稻级别的泛基因组(pangenome)图谱。构建的泛基因组包含69,531个基因,其中发现13,728个为野生稻特有基因。这些特有基因主要参与防御响应和ADP结合过程。研究通过构建系统发育树将O. rufipogon进一步分为6个分支(Or-Ia、Or-Ib、Or-II、Or-IIIa、Or-IIIb和Or-unspecified)(图1),证实籼稻与Or-Ia、粳稻与Or-IIIa的密切关系,而Or-IIIb和Or-II与栽培品种的亲缘关系较远。为获得可扩展的全面遗传多样性,研究还构建了图形泛基因组,分别包含15个栽培稻、129个野生稻。图形泛基因组分析显示野生稻平均贡献29.72Mb非参考序列,远超栽培稻的17.47Mb。图形泛基因组在检测所有类型遗传变异方面比线性参考基因组更具优势。

图1 149个代表性野生和栽培水稻品种及泛基因组构建分析

通过对本研究所有样本及已发表33个栽培稻泛基因组中28份亚洲栽培稻的TE注释分析,发现野生稻平均TE含量(53.23%)略高于栽培稻(52.32%),这解释了野生稻基因密度较低的现象。Or-IIIa群体的TE含量显著高于其他群体,而粳稻的TE含量最低。转座元件(TE)进化分析表明,Gypsy家族在Or-IIIa群体中约2.5万年前经历显著扩张,相较粳稻基因组,17个关键Gypsy家族贡献了25.85Mb序列差异。在Or-IIIa中鉴定出约1,000个与扩张Gypsy家族相邻的基因,这些基因显著富集于碳水化合物和萜类代谢和细胞表面信号转导通路,暗示其在环境适应和抗病过程中发挥积极作用(图2)。

图2 野生和栽培水稻的基因组变异和TE组成分析

04 亚洲栽培稻的演化与驯化历程
亚洲栽培稻(O. sativa)的起源问题在学术界一直存在争议。为深入解析这一复杂问题,该研究通过群体结构分析表明粳稻和basmati稻起源于Or-IIIa群体,籼稻起源于Or-Ia群体,aus稻主要起源于南亚的Or-Ib群体。遗传多样性分析显示野生稻的核苷酸多样性显著高于栽培稻,Or-Ia与籼稻的基因组距离(FST和DST)明显小于其他栽培稻与其野生祖先的距离。基因流分析发现Or-Ia中存在约40 Mb的籼稻渗入片段,Or-unspecific群体可能是Or-II与籼稻杂交的产物。系统发育树揭示南亚存在一个特殊的籼稻分支,该分支与Or-Ib和aus稻聚为一类,被证实为籼稻与aus稻的杂交后代,这些发现为理解亚洲栽培稻复杂的演化和传播历史提供了新的分子证据。

图3 野生稻与栽培稻的种群结构及基因渗入分析

亚洲栽培稻的驯化模式一直存在单次驯化与多次独立驯化的学术争议。研究根据选择性清除分析鉴定出12.35Mb的驯化区域,成功捕获了水稻驯化早期关键基因,包括Bh4PROG1sh4FZP等11个已知驯化基因。这11个关键驯化基因的单倍型分析为早期驯化史提供了决定性证据。单倍型网络显示所有栽培稻中这些早期关的驯化基因均与Or-IIIa单倍型直接相关或通过粳稻单倍型间接关联,主要单倍型与最近Or-IIIa单倍型间的变异位点可能是驯化过程中的选择靶点。结合系谱分析将各驯化基因划分为驯化型和祖先型,其品种间分布模式印证了以下驯化路径:粳稻最早由中国南方Or-IIIa群体驯化,向东南亚扩散后与当地Or-Ia和Or-Ib杂交形成籼稻和

aus稻,南亚栽培稻频繁杂交产生intro-indica(籼稻×aus稻),intro-indica与粳稻杂交形成basmati稻(图4)。这些结果强有力支持亚洲栽培稻单次驯化假说。

图4 亚洲栽培水稻进化路线

05 籼稻与粳稻的遗传分化机制
作为亚洲栽培稻的两个主要亚种,籼稻与粳稻表现出显著的遗传分化。该研究基于籼稻和粳稻品种,分别鉴定出855,122个高度分化的SNP和13,853个分化PAV。通过对祖先群体中主要等位基因(频率≥60%)的分析,约77%的分化SNP和83%的分化PAV可用于追溯起源,其中60.75%的分化SNP在Or-IIIa(粳稻祖先)与Or-Ia(籼稻祖先)间已存在差异。粳稻偏好型占30.40%,籼稻偏好型仅2.43%。PAV分化也呈现类似分布模式,且粳稻偏好性更强。另外通过数量性状核苷酸(QTNs)分析发现49个分化QTNs中,51%源自祖先分化,37%为粳稻偏好型。这些结果反映了粳稻经历了更严重的遗传瓶颈,导致其保留更多祖先分化变异,积累更多功能突变,形成独特的表型特征。这些发现揭示了两个亚种分化的多层次机制:既保留了古老的群体分化痕迹,又通过差异化的驯化选择塑造了各自独特的农艺特性。粳稻更强的遗传瓶颈可能与其地理隔离和人工选择强度相关,这为理解亚种特异性状的形成提供了新视角。

图5 籼稻和粳稻之间的遗传差异

总结
这项研究构建了野生-栽培水稻泛基因组数据库,为解析水稻驯化历史和育种改良提供了重要资源。野生稻特有的基因库(如抗病和环境适应相关基因)可助力培育高产、抗逆新品种。未来通过结合野生稻表型研究和从头驯化技术,有望加速水稻育种进程,为应对气候变化下的粮食安全挑战提供了基因层面的解决方案。

中国科学院分子植物科学卓越创新中心韩斌院士和赵强研究员为本文共同通讯作者,博士研究生郭东灵和高级工程师李艳为本文共同第一作者。上海师范大学黄学教授也为该研究提供了大力支持。该研究受到国家自然科学基金、中国科学院先导专项和国家农业农村部重点研发项目的资助。

文章链接:

https://doi.org/10.1038/s41586-025-08883-6