马尾松毛虫——首个枯叶蛾科昆虫染色体水平基因组

近日,中国林业科学研究院森林生态环境与保护研究所、首都师范大学、中国科学院植物生理生态研究所、希望组科技服务等多家单位,联合在Molecular Ecology Resources期刊发表题为”Chromosome-level genome assembly of an important pine defoliator,Dendrolimus punctatus (Lepidoptera; Lasiocampidae)”的研究论文。该研究利用三代测序技术结合Hi-C技术组装出马尾松毛虫染色体水平基因组,为这一重要林业害虫的生物学过程、功能与进化研究提供了重要遗传资源。中国林业科学研究院森林生态环境与保护研究所张苏芳副研究员为第一作者。中国林业科学研究院森林生态环境与保护研究所张真研究员,首都师范大学生命科学学院张爱兵教授,中国科学院植物生理生态研究所黄勇平研究员、詹帅研究员,以及希望组韩玲玲博士为共同通讯作者。希望组彭炯、任平平为本研究共同作者。希望组承担了该研究中三代测序、组装和部分分析工作。

松毛虫(Dendrolimus是鳞翅目、枯叶蛾科、松毛虫属的统称,是发生量大、危害严重的主要森林害虫。其中的典型代表,马尾松毛虫(Dendrolimus punctatus)幼虫取食松针,爆发期间连片松林数日内被蚕食精光,远看枯黄、焦黑,如同火烧一般,常称为“不冒烟的森林火灾”,给林业生产造成重大的经济损失。然而,从分子生物学角度对松毛虫成灾机理方面的探索比还较少,限制了我们深入理解其成灾的内部分子机理。因此,亟待从其本身的遗传和基因组角度深入探究松毛虫的成灾机制,才能形成更加有效的可持续控制体系。

马尾松毛虫生活史。(a)  (b) 幼虫 (c)  (d) 雌性成虫 (e) 雄性成虫

本研究以自然群体中马尾松毛虫雌性成虫为样本,k-mer分析显示基因组大小约为596.1Mb,杂合度1.70%,属于高杂合基因组。随后,利用PacBio测序技术结合Hi-C染色体构象捕获技术,组装出包含30条染色体的马尾松毛虫高质量基因组。最终版本基因组大小为614 Mbcontig N501.39 Mbscaffold N50 22.15 MbHi-C挂载率为 96.96%。组装基因组质量评估发现,99.7%的短读长数据会比至基因组,BUSCO完整性评估达到96.4%,表明组装出的马尾松毛虫基因组序列完整、错误率低。研究者将马尾松毛虫分别与两个鳞翅目昆虫(斜纹夜蛾、家蚕)基因组进行比较,基因共线性程度高,符合前人提出的鳞翅目昆虫基因位点或共线性排序相似的研究结论,再次证实马尾松毛虫的高质量基因组。马尾松毛虫基因组共注释到17,593个蛋白编码基因,其中15,914个基因获得了功能注释,重复序列占全基因组的56.16%

马尾松毛虫染色体水平组装。(a) 马尾松毛虫Hi-C热图。 (b) 马尾松毛虫与斜纹夜蛾基因组共线性图。 (c) 马尾松毛虫与家蚕基因组共线性图。
利用马尾松毛虫与其他11种昆虫的1,170个单拷贝直系同源基因构建系统发育树。小菜蛾(P. xylostella)位于鳞翅目昆虫进化枝的最基部,马尾松毛虫与家蚕亲缘关系最接近,并可能与美国白蛾额、斜纹夜蛾、松异舟蛾的共同祖先在108.91百万年前发生分化。发生分化后,马尾松毛虫有2,104个基因家族发生扩张,1,900个基因家族收缩。扩增的基因家族中与外源化合物降解和解毒系统相关的基因显著富集。

马尾松毛虫与其他11种昆虫的系统发育树

随后研究者在马尾松毛虫基因组中鉴定了与解毒相关的基因家族,并与其他鳞翅目昆虫的相似基因家族进行了比较。马尾松毛虫中共鉴定到132P450基因,转录组数据显示编码P450的基因表现出幼虫偏倚的表达模式。马尾松毛虫中P450基因家族的CYP3族相比家蚕有明显的扩张,既往研究表明,CYP3家族成员参与了外源化合物代谢和杀虫剂抗性,并与宿主植物的某些防御化学物质的耐受性有关。马尾松毛虫CYP3家族基因进化扩展和幼虫期表达偏倚可能与对松针抗性化合物的耐受性有关。

4 (a)P450基因在马尾松毛虫四个发育时期表达情况。(b) 马尾松毛虫(红点)与家蚕基因组中P450基因的三个族。

高质量的马尾松毛虫基因组将为在基因组水平研究这一重要林业害虫的各种生物学过程提供机会,并将为马尾松毛虫和其他枯叶蛾科昆虫的功能和进化研究提供有价值的资源。

0 回复

发表评论

想参加讨论吗?
请尽情讨论吧!

发表评论

电子邮件地址不会被公开。 必填项已用*标注