从Science野生二粒小麦基因组到小麦基因组大家族

普通小麦基因组高达17Gb,为异源六倍体AABBDD类型,且含有80%的重复序列,使得小麦基因组解密历程艰辛。研究学者面对困难,勇敢直前,一步一步地绘出不同小麦基因组图谱。近期,研究者再次添砖加瓦,于Science发表野生二粒小麦基因组研究成果。

解析野生二粒小麦基因组AABB

现代的六倍体小麦AABBDD Triticum aestivum是经异源四倍体野生二粒小麦Triticum turgidum(WEW)驯化为有脱粒特性的现代二粒小麦(DEW)后,与二倍体DD Aegilops tauschii杂交形成。野生二粒小麦基因组的解析将可以从另外一个角度了解小麦的进化。

基因组组装

WEW基因组在测序策略上,构建了不同大小插入片段文库,经176x 深度的Illumina测序组装,组装10.1G基因组,Contig N50 57.37k,经遗传图谱和Hi-C进一步验证组装,最后得到Scaffold N50=6.96M,将基因组锚定到染色体上,然而,其中不确定的Scaffolds有0.4Gb,Scaffolds间gaps有~1.5Gb,经BUSCO评估,基因组组装完整度在98.4%。

注释及进化分析

WEW的2个亚基因组的同源性分析,发现其中72.3%同源基因对,同源基因对的表达模式和表达水平相似。另外少量同源基因对只在一个亚基因组中表达,功能富集分析表明,亚基因组调控的基因表达可能与小麦品种相关。

在WEW基因组注释中,预测了82.2%转座子序列,大多数转座子元件为长末端重复反转录转座子LTR-RTs,不同类型的转座子在2套亚基因组中含量相似。而大部分全长LTR-RTs在150W年前发生扩张。Ty3和未分类的转座子在A与B亚基因组中类似,而Ty1/copia发生在500W年前,这与A和B亚基因组杂交的预计时间相一致。

为了进一步研究不落粒的驯化性状,对Zavitan和Svevo杂交,发现了调控脆性BR表型的基因区域,其中包括WEW染色体3A和3B上的2个位点(15.5Mb,32.5 Mb),确定了小麦基因(chromosome-3A: TtBtr1-A和 TtBtr2-A;chromosome-3B: TtBtr1-B 和TtBtr2-B)。在栽培种中TtBtr1等位基因在编码区发生突变,而在栽培种和野生种中,TtBtr2未发生编码区突变,推断2个基因中的突变是互补的,获得R栽培表型。

通过外显子测序,驯化和野生二粒小麦显著分离成2个亚群,野生二粒小麦分布以色列、叙利亚、黎巴嫩和土耳其地区,栽培二粒小麦分布印度洋、地中海、东欧和高加索地区,与野生小麦相比,栽培小麦的多样性下降。

小麦基因组解密历程艰辛

面包小麦即普通小麦(Triticum aestivum)是世界上种植面积广泛的农作物,是全球重要的粮食作物。普通小麦基因组不仅规模大(高达17Gb),而且基因组复杂,为异源六倍体AABBDD类型,含有3套亚基因组,亚基因组间相似性高,无法定位基因来自哪套染色体,且含有80%的重复序列,这些都使得小麦基因组解密历程艰辛。

异源六倍体小麦基因组的常规测序策略是通过构建BAC文库,结合鸟枪法测序;在材料选择上,会选择从小麦的二倍体供体开始基因组测序,为下一步深入解析六倍体小麦基因组及驯化、重要农艺性状等研究做参考。

下面组学君盘点了已发表小麦基因组的几个典型。

2012年11月,Nature,Triticum aestivum,AABBDD

利物浦大学、加州大学戴维斯分校等 9所研究机构合作对小麦基因组进行了测序。研究中经454测序平台对普通小麦栽培品种Chinese Spring基因组进行测序组装,并与其二倍体祖先基因组比较,确定了9万多个基因。分析发现普通小麦在多倍化和驯化过程中,基因组中有大量基因家族丢失和基因片段冗余。其中发生扩张的基因家族大部分参与能量采集、代谢和生长等过程,与作物产量相关。进一步,研究确定了小麦基因与特定性状之间的关联,这些都为加速栽培小麦育种提供遗传资源。

2013年3月,Nature,Triticum urartu,AA

中科院遗传与发育生物学研究所领衔完成了小麦A基因组的测序工作。小麦A基因组的祖先物种二倍体野生一粒小麦,即乌拉尔图小麦,经91X的 Illumina HiSeq 2000测序,组装得到Contig N50=3.42 kb,Scaffold N50=63.69 kb,基因组序列注释结果表明,66.88%的基因组为重复元件,同时发现一些重要农艺性状基因和分子标记。

2013年3月,Nature,Aegilops tauschii,DD

中国农业科学院作物科学研究所牵头完成对小麦D基因组测序,经90X不同插入片段的短读长测序,组装的Scaffolds覆盖了83.4%基因组信息,其中65.9%为转座子,经RNA-seq对确定了43,150编码蛋白基因,其中71.1%经遗传图谱锚定到染色体上。基因组组装注释分析,揭示了与抗病性、生物胁迫和籽粒品质相关的基因家族发生扩张。

2014年7月,Science,Triticum aestivum,AABBDD

中国农业科学院作物科学研究所牵头完成对小麦D基因组测序,经90X不同插入片段的短读长测序,组装的Scaffolds覆盖了83.4%基因组信息,其中65.9%为转座子,经RNA-seq对确定了43,150编码蛋白基因,其中71.1%经遗传图谱锚定到染色体上。基因组组装注释分析,揭示了与抗病性、生物胁迫和籽粒品质相关的基因家族发生扩张。

未来展望

依据测序技术不断发展,基因组的解析有了更多选择。在2017年PAG会议中,中国农业科学院作物科学研究所报道了最新的节节麦DD基因组进展,通过结合DeNovoMagicTM2 Nrgene,Illumina X10,PacBio和10xGenomics数据,组装结果不断提升。并通过Cytogenetic技术, CEGMA, BUSCO分析,与BAC序列比对评估组装结果,均表明组装结果有很大提升。

目前PacBioSMRT长读长测序技术是复杂基因组测序组装的利器,组学君认为这一优势将能在异源六倍体小麦基因组及二倍体四倍体小麦基因组的深入解密中发挥优势,填补基因组中gaps,挖掘更多小麦基因组家族中的“暗物质”。等待各位研究学者的持续解密!未来组愿助力各位在小麦及其他作物研究中的工作。

参考文献

1.Avni R, Nave M, Barad O, et al. Wild emmer genome architecture and diversity elucidate wheat evolution and domestication[J]. Science, 2017, 357(6346): 93-97.

2.Brenchley R, Spannagl M, Pfeifer M, et al.Analysis of the bread wheat genome using whole-genome shotgun sequencing[J].Nature, 2012, 491(7426): 705-710.

3.Ling H Q, Zhao S, Liu D, et al. Draft genome ofthe wheat A-genome progenitor Triticumurartu[J]. Nature, 2013, 496(7443): 87-90.

4.Jia J, Zhao S, Kong X, et al. Aegilops tauschii draft genome sequence reveals a gene repertoire for wheat adaptation[J]. Nature, 2013, 496(7443):91-95.

5.International Wheat Genome Sequencing Consortium. A chromosome-based draft sequence of the hexaploid bread wheat (Triticum aestivum) genome[J]. Science,2014, 345(6194): 1251788.

6.Marcussen T, Sandve S R, Heier L, et al. Ancient hybridizations among the ancestral genomes of bread wheat[J]. Science, 2014,345(6194): 1250092.

7.Pfeifer M, Kugler K G, Sandve S R, et al. Genome interplay in the grain transcriptome of hexaploid bread wheat[J]. Science,2014, 345(6194): 1250091.

8.Choulet F, Alberti A, Theil S, et al. Structural and functional partitioning of bread wheat chromosome 3B[J]. Science, 2014,345(6194): 1249721.

0 回复

发表评论

想参加讨论吗?
请尽情讨论吧!

发表评论

邮箱地址不会被公开。 必填项已用*标注