未来组2019成果首秀!五谷“元老”庆丰年
组学君:错,今天我们聊“黍”!稻、黍、稷、麦、菽五谷中的黍!
路人甲:那不就是糜子,又叫黄米嘛!
组学君:对!民以食为天,从古诗歌中我们了解到在西周末年到春秋初期糜子就是关乎生计的重要作物,而其最早的栽培史可以追溯到距今七千到一万年前,五谷“元老”名副其实呀!
路人甲:
组学君:最近未来组参与合作的糜子基因组近完成图发表于Nature Communications,当然要细说一番啦!
路人甲:快进入正题吧!
Chromosome conformation capture resolved near complete genome assembly of broomcorn millet (Nature Communications, IF: 12.353)
糜子(Panicum miliaceum L., 2n = 4 × = 36)作为一种古老的作物,具有生长周期短(~60–90d),耐盐碱的特性,尤其是极端抗旱,其耐旱能力甚至比蒸腾系数低于高粱、玉米、小麦的谷子还要强。这种对非生物胁迫的超强耐受性机制一直为研究者所好奇。近日,糜子高质量参考基因组终于问世,该研究由中国农业大学赖锦盛教授团队主导,相关研究文章发表在Nature Communications杂志,从分子角度挖掘了潜藏这一机能的秘密。武汉未来组为该研究提供了PacBio测序及组装。
测序方法:
PacBio、Illumina、BioNano、Hi-C
组装策略:使用Falcon对~170×PacBio长读长数据进行基因组组装,用~116×Illumina短读长数据进行polish,结合~235×BioNano数据辅助构建scaffold,再利用~140.2×Hi-C数据进行模拟染色体构建。
研究首先用K-mer分析预估了Longmi4基因组大小约为谷子的两倍,证实了其四倍体化事件,然后基于PacBio和Bionano数据组装出了约848.4Mb的基因组,组装指标Contig N50 达2.55Mb,scaffold N50 达到8.24 Mb,包含了18条super scaffolds,覆盖了~95.6%的基因组(见Table 1)。接着研究通过全基因组测序和RNA-seq数据分别对组装好的基因组进行比对以评估组装的质量,比对率达到了99.6%和91.5%,说明组装质量非常好;经BUSCO评估发现基因完整度高达98.0%,标明组装完整度和准确度都非常高!
最后,精益求精的研究者还将Hi-C数据纳入其中以将scaffolds锚定、排序,通过深度约140.2×的覆盖将444条scaffolds装出了19条超长scaffolds以进一步分析。研究发现Longmi4染色体内Hi-C互作矩阵中出现明显的反对角图案(Fig. 1a),反映出所谓的染色体Rabl构象(间期染色体长短臂平行折叠)。基因组比较分析揭示了糜子和谷子之间的2对1的共线关系(Fig. 1b)。与玉米基因组不同,糜子的染色体在基因组四倍化后并未发生明显的融合现象,但染色体内的重排尤其是倒置现象在糜子基因组中广泛存在。例如在pm5和pm8两条染色体上,就有两个大小约为11.8 Mb和8.9 Mb的区域发生了倒置(Fig. 1b)。同时,研究者还发现pm3、pm10、pm14和pm15号染色体末端的一致性,它们之间是两对同源染色体,由此推测这对染色体末端之间的交换应是发生在糜子基因组四倍化之前。
Fig. 1 Hi-C技术辅助构建Longmi4模拟染色体
(a)200kb分辨率下的Hi-C互作热图
(b)糜子(pm1–pm18)和小米(si1–si9)基因组比较
通过结合~68.6 Gb的RNA-seq数据及一些近缘物种的蛋白序列,研究者在糜子基因组中预测出63,671个蛋白质编码基因,其基因数量几乎是谷子基因数量(34,584)的2倍。基因组比较分析发现,糜子和谷子共有19,609个基因,在这些基因中,有16,884(~86.2%)个基因在糜子基因组中都拥有两个同源拷贝,表明在发生全基因组复制事件(WGD)之后糜子基因组中丢失的基因较少(Fig.2 )。
Fig.2 以小米基因组为参考分析糜子基因组中的基因丢失与保留
更重要的是,与一般ABA基因的诱导表达不同,这15个ABA基因中有四个基因存在持续表达的表达谱,充分暗示了这些基因可能参与了糜子的极端非生物胁迫抗性。
Fig.3 NB-ARC结构域基因在糜子的18条
模拟染色体上的分布情况
研究者发现在糜子基因组中~54.1%的序列为重复序列,其重复度在谷子和珍珠稷之间(二者基因组重复序列含量分别为~46.8%和~68.0%)。与其他谷物类似,LTR反转座子尤其是Gypsy超家族是糜子基因组中最主要的重复元件(Gypsy超家族占比~31.4%)。研究者对包括糜子在内的5种作物中的Gypsy和Copia家族的插入时间进行了分析,发现玉米和高粱中Gypsy元件在近期有一次爆发,其他三个物种的爆发时间较早,但都发生在距今~100万年以内(Fig.4a)。相比之下,糜子基因组中的Copia家族的爆发时间要早得多,大约发生在距今200万年前(Fig.4b)。
Fig.4 糜子 (P. miliaceum)、谷子 (S. italica)、珍珠稷 (P. glaucum)、高粱 (S. bicolor)、 玉米(Z. mays)基因组中的Gypsy (a) 和Copia (b)的插入时间分析
研究利用组装的高质量的糜子基因组、新发表的珍珠稷基因组和Dichanthelium oligosanthe基因组进行联合分析,构建了黍族系统发育树(Fig.5)。系统发育分析揭示了糜子的异源四倍体化发生在591万年之内,而糜子和谷子的分化大约发生在1310万年前。
Fig.5 黍族的系统发育分析
本研究所报道的高质量糜子基因组序列不仅对理解糜子基因组四倍体化后的动态进化具有重要意义,而且对今后的糜子分子育种也有一定的参考价值,并将促进黍属植物与其他作物的比较基因组研究。
同时,研究结合了三代长读长全基因组测序技术、二代短读长测序技术、Bionano光学图谱、Hi-C染色体构象捕获等技术优势,获得了高质量的糜子基因组,说明了多组学平台的结合对于复杂程度高的作物具有显著的优势。近年来,不断有高等植物通过该手段获得了良好的组装质量,如武汉未来组2018年参与的玉米基因组文章[2]借助PacBio辅以Illumina、Bionano技术登上了Nature Genetics,Bionano光学图谱已成为破解作物遗传密码的首选秘密武器。还有借助Hi-C技术登上Science的小麦[3]和其他作物如日本晴[4]、苦荞[5]等,可以说杂合、重复已不再是基因组难题,对于它们基因组的解析在分子育种、农业生产以及特性优化方面都有着不可估量的价值。
延伸阅读:
Nature Genetics | 三代测序揭示玉米种内存在广泛的基因结构变异
ONT + 光学图谱 = 染色体水平的植物基因组
Nanopore 和 BioNano DLS 双剑合璧实现染色体级别高粱基因组
未来组三代基因组项目再出新篇!“英雄树”木棉基因组草图首发
小麦基因组草图到精细图的利器:长读长测序+光学图谱
参考文献
[1] Junpeng Shi, Xuxu Ma, Jihong Zhang, et al. Chromosome conformation capture resolved near complete genome assembly of broomcorn millet[J]. Nature Communications, 2019.
[2] Sun, S. et al. Extensive intraspecific gene order and gene structural variations between Mo17 and other maize genomes. Nature Genetics (2018).
[3] Avni, R., Nave, M., Barad,et al. (2017). Wild emmer genomearchitecture and diversity elucidate wheat evolution and domestication. Science, 357(6346), 93-97.
[4] Dong Q , Li N , Li X , et al. Genome-wide Hi-C analysis reveals extensive hierarchical chromatin interactions in rice[J]. The Plant Journal, 2018.
[5]Zhang L , Li X , Ma B , et al. The Tartary Buckwheat Genome Provides Insights into Rutin Biosynthesis and Abiotic Stress Tolerance[J]. 分子植物:英文版, 2017, 10(9):1224-1237
发表评论
想参加讨论吗?请尽情讨论吧!