项目文章 |《Nature Genetics》番木瓜基因组研究

2022年5月12日,海峡联合研究院基因组与生物技术研究中心研究团队在国际权威学术期刊《自然遗传学》(Nature Genetics)在线发表了题为“ SunUp and Sunset genomes revealed impact of particle bombardment mediatedtransformation and domestication history in papaya”的研究成果。希望组提供Bac-long超长测序服务。

背景介绍

番木瓜是一种优质热带水果,在我国有“岭南佳果”之美誉,拥有“乔木葱葱滋地气,圆实累累衬红霞”的赞叹。番木瓜不仅汁多味甜,而且具有很高的营养和药用价值,在中国的早期典籍《食物本草》中就有记载。

番木瓜科由6个属共40个种组成,番木瓜属于番木瓜科番木瓜属,主要分布于热带和亚热带地区,野生番木瓜仅在墨西哥南部和中美洲发现。番木瓜于17世纪传入我国,最早在1661年的《九江乡志》书中有记载,称之为“万寿果”,说明我国栽培番木瓜至少有300多年历史了。

1992年,由于番木瓜环斑病毒(PRSV)的大流行,番木瓜产业面临崩溃的威胁。转基因番木瓜品种的诞生使番木瓜产业免遭PRSV的毁灭,这是番木瓜生产上的第一次革命性突破,是转基因作物拯救整个产业的一个典型的成功案例。目前番木瓜是我国批准商业化种植的唯一转基因水果作物。

部分研究细节

然而在获得转基因植物的过程中,外源DNA片段是如何整合到核基因组上的?整合过程中植物基因组发生了哪些结构变异?这些结构变异对基因功能造成了哪些影响?

通过全基因组共线性分析,研究者在SunUp品种的5号染色体上发现两个大的结构变异,一个1.6 Mb插入和591.9 Kb的缺失(图1)。研究发现,三个转基因片段均位于该1.6 Mb的插入片段上,并且三个转基因插入片段的6个侧翼序列中有5个侧翼序列来源于核质体基因组片段(NUPTs),它们在转基因过程中经历了结构变异,只有一个序列来源于核线粒体基因组片段(NUMTs)并且未发生结构变异(图1)。对1.6 Mb和591.9 Kb这两个大的结构变异上的基因进行分析,研究者意外的发现几乎所有基因都是叶绿体和线粒体基因组编码基因。通过 SunUp和Sunset品种不同发育阶段的叶和花组织的表达谱分析发现:两个结构变异上的差异表达基因中只有9个基因是单拷贝基因,表明基因枪轰击介导的转基因可引起显著的基因组结构变异,但是对基因功能造成的影响非常小,这为植物基因枪轰击介导的转基因过程对基因组结构和功能的影响提供了直接的证据。

图1. SunUp 基因组中转基因插入的整合位点(a)SunUp和Sunset 5号染色体的共线性比对;(b)SunUp 1.6 Mb的片段插入在Sunset 5号染色体上;(c)三个转基因片段在质粒上的位置与在1.6 插入片段上的位置对比;(d)三个转基因片段的6个侧翼片段在SunUp和Sunset中的比对。

SunUp和Sunset基因组的比较分析进一步发现1.6 Mb插入片段是由77个重排和异位的片段组成,包括3个转基因片段、61个来自Sunset核基因组的片段和13个来自叶绿体和线粒体细胞器基因组的片段。其中 61个核基因组片段包括1个核基因组、18个NUMTs和42个NUPTs片段(图2)。这个结果说明转基因插入位点偏向于插入叶绿体富集区域,具有“偏好性”。通过以上发现,研究人员推测了基因枪介导的外源基因整合到基因组的可能机制:外源 DNA片段整合到富含NUPTs的区域,伴随着基因组中已有的NUPTs、NUMTs和核基因组序列发生多聚化、异位以及重排。由于基因枪穿透细胞引发的损伤反应促使叶绿体和线粒体细胞器片段整合到转基因插入片段所在的多聚化区域,这种机制可能是植物自身应对外界伤害的一种精密的自我保护的调控机制(图3)。

图2. SunUp 5号染色体上的 1.6Mb 插入片段来源分布图

图3. 外源 DNA 整合到核基因组中的模式图

总结

该研究破译了番木瓜转基因品种SunUp与非转基因品种Sunset高质量的基因组图谱,首次揭示了植物基因枪介导的转基因过程对基因组结构和功能的影响,以及番木瓜地理起源和驯化历史。该成果是在植物转基因过程解析方面取得的原创性突破,对深入解密植物转基因过程具有重要参考价值,对推动果树作物的基础研究以及品种改良等具有里程碑式的意义。

更多细节:我中心《Nature Genetics》在线发表番木瓜基因组研究成果
文章链接:https://www.nature.com/articles/s41588-022-01068-1
研究简报链接:https://www.nature.com/articles/s41588-022-01030-1

世界上最毒蘑菇是如何炼成的?——昆明植物所在毒蘑菇鹅膏环肽毒素合成机制研究中取得重要进展

近日以Genes and evolutionary fates of the amanitin biosynthesis pathway in poisonous mushrooms为题在国际著名期刊Proceedings of the National Academy of Sciences of the United States of America(PNAS)的遗传学板块全文发表。中国科学院昆明植物研究所罗宏副研究员为该论文的第一作者和共同通讯作者,吕李云娇博士研究生为共同第二作者,法国农业科学院Francis M. Martin院士为论文的共同通讯作者。该研究得到中国科学院B类先导专项(XDB31000000)和国家自然科学基金面上项目(31972477、31772377)的经费支持。希望组提供真菌测序服务。

有毒蘑菇对人类健康常常造成威胁,但同时也是重要药物和功能分子的来源。危害最大的有毒蘑菇当属鹅膏属的某些真菌,绝大部分的致死中毒案例由这一类蘑菇所致。剧毒鹅膏中的毒素为鹅膏环肽,但鹅膏环肽并非仅鹅膏属真菌独有,在亲缘关系很远的环柄菇属和盔孢伞属中,也有能产生这类毒素的真菌。

中国科学院昆明植物研究所的科研人员在研究中发现了两个鹅膏环肽合成新的关键基因(P450-29和FMO1),二者为不同的加氧酶,负责在鹅膏环肽毒素的关键位点(异亮氨酸C-5和脯氨酸C-4等)引入氧原子。若缺少这些氧原子,将导致毒素的活性下降1000倍以上。该结果将已知毒素合成基因从原来的2个增加到了4个,对鹅膏环肽生源合成途径有了更为深入的认识。通过建立目前全球唯一的剧毒鹅膏基因组平台,构建了鹅膏属、盔孢伞属和环柄菇属中13个剧毒物种的基因组数据库,完整解析了鹅膏环肽生源合成途径在蘑菇目中的整体架构,发现在蘑菇目三个不同属中,鹅膏环肽的主要合成基因是相同或相似的,因此鹅膏环肽生源合成途径是同宗同源的。系统发育和遗传学研究证据表明鹅膏、盔孢伞、环柄菇之所以都能产生鹅膏环肽毒素,其根源是基因水平转移。更深入的进化分析表明,基因水平转移发生的年代久远且并非直接发生在这几类蘑菇之间,而是由未知古老真菌物种作为供体分别传递给了这些蘑菇(图)。

研究首次证实,在蘑菇目中,虽然鹅膏、盔孢伞、环柄菇间的亲缘关系较远,但其产生鹅膏环肽毒素的遗传学基础是一致的,均由相似的基因控制。但令人吃惊的是,在进化长河中,上述三大类蘑菇中的毒素合成能力却发生了翻天覆地的变化。在木腐生的盔孢伞属真菌中,仅有1个毒素前体基因且该基因编码α-鹅膏毒肽;在土壤腐生的环柄菇属真菌中,存在MSDIN前体基因家族的轻微扩张,有约10种毒素前体基因;在菌根共生的鹅膏属真菌中,MSDIN前体基因家族存在显著扩张,甚至还产生了新的毒素修饰基因,可将环肽数目再扩大数十倍,因此鹅膏的实际产毒能力是盔孢伞和环柄菇的成千上万倍!

简而言之,虽然鹅膏、盔孢伞、环柄菇都继承了由供体转移来的毒素基因,但可能受到不同生理和生态压力的影响,分道扬镳,各自朝不同的方向进化,最终形成了三种迥异的命运(图)。鹅膏是其中的佼佼者,其鹅膏环肽生源合成途径产生了众多创新,产毒能力提升了千倍万倍,炼成了当之无愧的蘑菇毒王!

鹅膏、盔孢伞、环柄菇中环肽毒素合成基因分布及代谢途径进化示意图

文章链接:http://www.kib.cas.cn/xwzx/ttxw/202205/t20220510_6445695.html

项目文章|三代测序(TGS)技术助力水稻泛基因组研究再攀高峰

基因组研究热点+前沿测序技术=基因组学顶级期刊!

泛基因组是一个群体中所有基因组的集合,在众多领域(尤其作物科学领域)的基因组研究中显示出巨大的潜力,泛基因组的构建和基因存在-缺失变异(PAVs)分析是基因组研究的新热点。目前基于二代测序技术(SGS),初步构建了主要作物(如水稻、玉米、大豆)的泛基因组,其中水稻泛基因组大小比水稻参考基因组(NipRG)日本晴要大近270 Mb。然而,使用二代测序数据构建的泛基因组仍存在基因组不完整和基因注释不准确的缺点。这些问题在很大程度上可以通过前沿测序技术——长读长的三代测序解决。

近日,上海交通大学生命科学技术学院韦朝春团队和中国农业科学院作物科学研究所合作完成基于三代测序数据的水稻泛基因组构建及分析,相关成果论文 “Long-read sequencing of 111 rice genomes reveals significantly larger pan-genomes”在基因组学顶级期刊《Genome Research》发表。希望组为本研究提供了二代和三代测序服务,自主研发的NextDenovo软件被应用于项目的关键环节——水稻基因组组装。

研究概要

研究挑选了111个代表性水稻品种,结合二代和三代测序技术进行全基因组测序,获得了连续性和完整性很高的个体基因组,并在此基础上构建了高质量水稻泛基因组,同时填补了9个代表性水稻群体的高质量参考基因组,其中包括5个gapless水稻基因组。

研究结果

1. 水稻泛基因组构建及特征分析

结合111个水稻基因组构建的高质量泛基因组有879Mb的非冗余新序列(序列相似度<90%,长度> 500bp)。新序列中转座因子占一半以上,其中逆转录因子52.71%,DNA转座子16.05%,名为Gypsy的长末端重复(LTRs)逆转录元件占比达47.83%。新序列分布于每条染色体上,Chr1新序列数量最多,Chr11新序列长度最长。除了 Chr4 和 Chr11 的端粒附近的两个峰以外,含高密度新序列的基因组区域倾向于位于着丝粒附近。另外,在所有水稻基因组中,野生稻包含的重复序列 LTRs 明显多于栽培稻。泛基因组变异分析的结果显示缺失和易位为主要的结构变异(structural variations,SVs)模式。

在水稻泛基因组中一共发现19319个新编码基因(分布于2132个新基因家族),其中89.5%包含至少一个功能区域。进一步统计分析,在所有基因中65.7%为核心基因,14.4%为候选核心基因(存在于90%的样本),19.6%为非核心基因家族基因(少于90%但不仅在一个样本中存在),0.2%为特有基因。

 图一 水稻泛基因组的基因组特征

2.测序技术及品种数量对构建泛基因组的影响

后续分析中分别构建了相同品种水稻的SGS和TGS泛基因组及品种数量不等的TGS泛基因组,比较分析结果显示:同样的测序技术,加入品种数量不同时,品种数量越多得到新序列越多;品种数量相同时,基于TGS技术构建的泛基因组比基于SGS技术构建的泛基因组得到的新序列多。

进一步对同品种SGS和TGS构建的泛基因进行PAVs分析,将全部基因分为TGS偏好、SGS偏好及无偏好三组。对比分析发现TGS偏好基因的GC含量更高,CDS长度更短;多数SGS偏好基因CDS区与重复元件重叠,与DNA转座子和LTR相关;具有较高LINEs和RC/Helitron比例的基因在TGS中比SGS中更频繁。这些结果表明,SGS数据在检测基因PAVs时往往会得到更高的假阳性率,尤其是对于包含重复序列的基因。

图二 SGS和TGS基因家族比较分析

3. 栽培稻表型关联分析

通过栽培稻基因PAV和表型关联分析,检测到14,471个显著的基因PAVs和表型的关联(8130个基因和9个表型)。例如LOC_Os01g27930(一种反转录转座子蛋白)的缺失与籽粒长宽比增加相关,而它的存在也与籽粒宽度增加相关;SD-1的缺失会导致植株高度的降低。这些结果表明,基因PAVs对水稻表型变异可能有重要贡献。

小结

本研究结合SGS和TGS数据构建了水稻高质量泛基因组,全面解析水稻基因组相关特征。研究结果将全面推动水稻的功能基因组学研究,为水稻品种改良提供重要参考资源。

项目文章 | 希望组异源四倍体组装案例——象草

象草超“能”,原因几何?

%、13%的木素,是生产高生物量、多种素素、草料和多种植物的重要植物。的炭原料,约45吨/公顷。理想下可收获3-4次。拥有如此巨大的量,但其本身却是天然生物基因的四倍体基因。的不同来源,却是四体基因。基因组组合,而不同的不同源头四种资源实现也分配。

近期,齐鲁源、齐鲁涛生物大学(山东省鲁涛生物大学)志课题组以及夏大学热带科学决策学院发表海南课题组于分子生态资源杂志上题为“染色体组长组合提供了不同的对科学院课题组”四倍体上确定了草草基础的鉴定和大象草的生物质(生物质积分)。研究和进化、基因家族分析、在项目中提供了新的视觉检测技术组合图谱、ONT超象草技术、ONT超象素基因组图技术、PacBio纳米技术、PacBio全长药物组合技术、Hi-D C技术以及下一个诺组件服务。

01 研究思路

02 研究结果

1. 源四倍体象草基因组的从头组件及注释

通过K-mer分析和流式细胞仪,象草的基因组排列预测为2.0 Gb和2.13 Gb。另外,通过K-mer分析的综合比例为1.3%。最终为2.22 Gb的组成序列当中,N50组合为 25 Mb8con。4N5M 组合 25 Mb。去 Gbtig 获得 N.46 组合后,con2.2.4 组合 N587 组合谱。90 Mb。10 倍的 Bioscaffold 以及 2.0.0 辅助的组合组合,通过了 N50 的基因组列表。 。 加载系数为 6.88% 的 N50146.844,BUSCO 97.8% M-9% 的评估为 C 77,19 帮助预测的一个。

图1 异源象草基因组圈图

2.异源四倍体象草的进化分析

禾本科植物和树种基因有不同的来源和类似的基因系统(图2)。三。禾本科植物的组合中线发生融合22马,植物形成组中线(图2b)。 2的编码基因’B亚的重建和染色体家族的后裔,1条染色体家族的共同支持,母体之间有2个基因组之间的关系。一个“基因组基因组整合”的源体组合(图2c和)似乎出现了3次多倍组化事件。中,一个亚组11492显着发现,1719个组,而象草B亚0031这些基因家族有2个发现有1个下来)。在进化过程中保留家族链(图)基因家族的家族基因组丰富的或能力亚基具有重要的分析能力。以及过氧化物的家族基因。

图2 狼蛛相关的尾草进化属中象草

3. 象草的生物量特性相关分析

在A’和B亚组中(图3b)的两个结果中,组和B亚组中的两个和三个重复分别出现的结果,A’B亚组的基因组序列相同。积分。

图3 象草的合成基因表达和速热图

136个基因的基因发现的木质素合成相关,个数源可能是由于对四象体形成了5亚种的加成。(图4b,通过WGCNA分析)鉴定了664个木质素合成的有加。

图4 象草和木素热合成的基因表达图

03 小结

本文利用三代长基因组基因技术以及辅助组件技术,象草生物量巨大的潜在成分组,为研究象草组的提供了组合、组合、组合、组合、多种组合化的重要和进化也为等方面提供了基础,其他开发利用的资源。

项目文章 | Nature Plants封面-苏铁基因组发布

种子植物包括裸子植物(gymnosperms)和被子植物(angiosperms),裸子植物分为四大类,即苏铁类(cycads)、银杏类(Ginkgo)、松柏类(conifers)和买麻藤类(gnetophytes)。裸子植物基因组较大,重复序列含量高,结构复杂,迄今为止,现存最原始种子植物苏铁分支尚缺少完整的基因组图谱。

2022年4月18日,由22个机构65位科学家联合在Nature Plants发表了题为“The Cycas genome and the early evolution of seed plants”的封面文章,报道了现存最原始种子植物苏铁参考基因组,填补了种子植物基因组研究的空白。苏铁基因组的发布,代表着种子植物基因组演化研究中的最后一块拼图完成,为后续比较基因组学的开展奠定了基础。希望组参与了本研究项目中攀枝花苏铁的测序、组装及初步注释服务。

苏铁基因组测序材料选取苏铁类的基部类群、也是整个苏铁类分布纬度最北的种类攀枝花苏铁(Cycas panzhihuaensis)。基于长片段测序与MGI-SEQ测序,苏铁基因组组装大小为10.5 Gb,contig N50为12Mb,结合Hi-C数据,挂载为11条染色体。其中共注释32,353个蛋白编码基因,BUSCO评估完整度为91.6%,是目前裸子植物中最高质量的大基因组图谱。

裸子植物具有4大分支,1118种,关于裸子植物内部大分支之间的系统演化关系一直有不同的学术观点。基于15个维管植物基因组3282个直系同源低拷贝核基因、90个种子植物转录组1569个直系同源基因、72种维管植物叶绿体和线粒体基因组数据的系统分析结果表明,苏铁单独(线粒体数据)、或和银杏一起(核基因、叶绿体数据)构成其它所有裸子植物的姐妹群。

基因组加倍是植物演化适应的重要驱动力,关于裸子植物共同祖先是否经历了全基因组加倍事件一直存在争议。研究者采用对重复基因同义替代分析和系统发育基因组学方法,并使用基因组内共线性区域进行比较验证,发现现存裸子植物的最近共同祖先可能经历了一次古老的全基因组复制事件(命名为ω,图一a)。伴随着种子植物起源,许多关键创新性状如种子发育、花粉、次生生长相关的基因家族均发生了创新或扩张。在种子植物的祖先节点共发现663个新获得的基因家族和368个扩张的基因家族。其中,106个新获得和55个显著扩张的基因家族与种子生理发育有关,包括调控胚胎早期发育、种子休眠和萌发、种子能量和营养代谢,种皮形成以及种子的免疫和应激反应等(图一b)。

图一、a) 基于系统发育关系推断种子植物的全基因组加倍事件;b) 种子植物的基因家族创新和扩张。

最显著扩张的种子生理相关家族是cupin蛋白家族。攀枝花苏铁编码一类新的vicilin-like贮藏蛋白 vicilin-like antimicrobial peptides(v-AMP),在基因组中呈串联基因阵列分布,多在授粉胚珠后期和受精胚珠时期表达,而后逐渐降低,暗示v-AMP基因在种子发育过程特定时期发挥重要作用。LAFL家族(LEC1ABI3LEC2FUS3)是种子发育核心调控基因,苏铁等裸子植物的FUS3LEC2基因可构成一个新的进化枝,定义为FUS3 / LEC2-like类型,与被子植物的FUS3LEC2形成姐妹分支关系。FUS3 / LEC2-like类别是裸子植物特有的。在攀枝花苏铁授粉后,其会表现出明显的表达,表明可能在裸子植物胚胎发生早期发挥特定作用 。

苏铁类起源于古生代二叠纪早期,距今已有至少2亿7千万年历史。在经历大量灭绝以后,现代苏铁多是近期几次辐射演化的后代。如今苏铁具有2科10属。研究者基于现存苏铁目339种植物的转录组数据,重建了苏铁类自身的系统发育关系。分子钟分析表明,现存苏铁的多样化同步发生于距今1100至2000万年之间,是中新世以来气候剧烈变化的结果(图二)。

图二、苏铁目系统发育树支持现存苏铁是辐射演化的结果

雌雄性别分化是一种进化性状。裸子植物已报道的1118个物种中,65%的种类都是雌雄异株, 而在被子植物中雌雄异株只占到6%。苏铁类植物均为雌雄异株(图三),由于其生长缓慢,以往只能在开花时才能判断性别,而成株树龄多在十年以上以及在适宜的环境才会开花。研究苏铁性别决定的分子机制,可以在植株进入花期前就确定性别,对于苏铁类植物的就地和迁地保护和园林培育具有重要意义。苏铁的性别控制基因一直困扰科学界。研究者通过对源于四川攀枝花苏铁国家级保护区62株雌雄苏铁群体测序,表达差异分析,和雄性Y染色体的组装,找到雌雄表达差异最大的一个基因来自雄株的Y染色体,该基因编码一个MADS-box转录因子,推测其调控雌雄苏铁的性器官发育,揭示了苏铁性别决定的遗传机制。该转录因子的同源基因也仅能在雄株基因组中检测到,说明了该性别决定机制在苏铁类植物中的保守性。

图三、a) 攀枝花苏铁;b) 攀枝花苏铁雄株和雌株的孢子体。

早期维管植物的精子都是有鞭毛,可以游动的。随着演化,鞭毛丢失。在现生种子植物中仅苏铁和银杏保留精子具鞭毛的特征。研究人员发现,苏铁和银杏均保留了大量鞭毛组装所需基因,但与苏铁相比,银杏中RSP类基因有一定的丢失(RSP2RSP3RSP 9, 和RSP11等)。此外,与鞭毛行使功能密切相关的外周致密纤维合成基因(ODFs),只在苏铁和银杏基因组中存在,在其它种子植物中则全部丢失。进一步证实了苏铁在种子植物演化中古老的地位。
水平基因转移泛指不同物种间的基因交流,在陆生植物适应性进化过程中起到推动作用。研究者在攀枝花苏铁基因组中发现一种细胞毒素蛋白基因(fitD),这种基因起源于细菌,通过水平基因转移的方式转移到真菌和苏铁中(图四a)。基于苏铁类339个物种转录组数据,研究人员发现该毒素蛋白只在苏铁属物种中存在。同时,fitD基因在种子和根部高表达,这可能也是苏铁种子和根部具有毒性的原因之一。基于基因重组技术,在大肠杆菌表达的毒素蛋白产物对小菜蛾和棉铃虫有显著致死性(图四b-f),显示出毒素蛋白具有一定的农业应用前景。

 图四、a)苏铁水平转移毒蛋白基因的演化历史。b-f) 苏铁毒蛋白基因表达,及对昆虫毒性实验。

该研究由深圳华大生命科学研究院、深圳市仙湖植物园、中国科学院昆明植物研究所、兰州大学、中国环境科学研究院、河南大学和南京林业大学等22个机构65位科学家联合完成。该论文第一作者为深圳华大生命科学研究院刘阳、王思博、李林洲、杨婷、魏桐,深圳仙湖植物园董珊珊,兰州大学武生聃等为共同第一作者,分别在基因组不同的领域贡献了自己的专业力量。深圳仙湖植物园张寿洲,深圳华大生命科学研究院刘欢,中科院昆明植物所龚洵,美国佛罗里达大学Douglas E. Soltis,比利时根特大学Yves Van de Peer为文章共同通讯作者。该项目得到深圳市城市管理和执法局科研专项、国家重点研发计划、生态环境部生物多样性调查与评估等基金支持。

项目文章 | 华中农大联合深圳基因所组装康乃馨染色体级别基因组并结合多组学数据解析花色、花型和花香等重要性状调控密码

康乃馨(Dianthus caryophyllus)是石竹科石竹属多年生植物。因其花色绚丽,花型独特,香气馥郁,深受世界各地人民的喜爱,被称作世界‘四大切花’之一,具有极高的观赏价值和经济价值。

2022年3月5日,华中农业大学园艺林学学院傅小鹏研究团队,联合中国农业科学院农业基因组研究所(简称‘基因组所’)武志强研究团队,在国际著名学术期刊Plant Biotechnology Journal上发表了题为“Integrated multi-omic data and analyses reveal the pathways underlying key ornamental traits in carnation flowers”的研究论文。希望组在本文章中提供了基因组测序及Hi-C测序服务!

该研究首次组装了康乃馨染色体级别的基因组,并结合比较基因组,转录组,代谢组等方法,系统地研究了康乃馨基因组的进化,并对康乃馨的花色,花型和花香等重要观赏性状的分子机理进行解析,鉴定了参与这些性状形成的关键基因。本研究的开展为定向改良康乃馨的观赏性状,培育康乃馨新品种奠定了基础。

研究团队利用第三代ONT、二代Illumina和HIC技术,对康乃馨栽培品种‘斯嘉丽’( D. caryophyllus, cultivar ‘Scarlet Queen’)进行了全基因组测序和组装。康乃馨(2n=30)的基因全长为636.30 Mb,重复序列占70.62%,共注释到43,925个基因,Contig N50 和Scaffold N50分别为14.67 Mb和38.55M。研究发现康乃馨与藜科在~64.07 MYA发生了分化,并经历了一次近期的WGT事件,这次加倍事件促进了康乃馨特殊香气丁香酚合成相关的基因的扩张。

图1.康乃馨基因组的组装与进化

基于本基因组,对康乃馨红边花瓣进行代谢组分析,发现天竺葵素的积累促使花瓣红边的成色,叶黄素和多个类黄酮物质的共同积累,促使花瓣基部成黄色;结合转录组分析,筛选到几个MYBs, bHLHs 和WRKY44等基因共同作用于ANS调控康乃馨复色的形成。同时,利用GC_MS以及转录组,对香石竹丁香酚在不同时期花瓣的积累过程进行解析,发现EGS基因存在外显子上的结构变异,其提前终止可能是康乃馨丁香酚丢失的原因。另外,研究发现康乃馨汇总A、C类基因的异位表达可能是影响重瓣型康乃馨形成的重要因素。

图2. 康乃馨花瓣花边颜色的形成

图3.潜在的康乃馨中丁香酚合成通路

 图4.康乃馨重瓣花形成的遗传机制

本研究为开展康乃馨重要观赏性状的调控和遗传改良提供了宝贵的数据信息和坚实的理论基础,对推动康乃馨分子育种育种具有里程碑式的意义。

华中农业大学博士张晓妮(现为基因组所武志强组博士后)为论文第一作者,华中农业大学傅小鹏教授和基因组所武志强研究员为共同通讯作者。该研究是在包满珠教授和BENDAHMANE教授全程指导和帮助下完成的。同时,该研究得到了国家自然基金、国家青年科学基金、深圳市科创委以及基因组所启动基金等的支持。

原文链接:https://onlinelibrary.wiley.com/toc/14677652/0/ja

文章来源:植物生物技术Pbj公众号

进展迅速丨高质量人类二倍体基因组组装策略来临

自T2T联盟于2021年5月在BioRixv预印版上发表了首个人类基因组完成图及相关文章之后,近日人类泛参考基因组联盟紧跟步伐在BioRixv预印版上发布了题为“Automated assembly of high-quality diploid human reference genomes”的文章。

样本来源

目前常用的人类参考基因组GRCh38,是科研团队花费20多年的努力而完成的高质量的人类基因组。该基因组极大程度上推进了生命科学相关领域的发展。但是它仍然存在着许多gaps(gap数已从原来的150,000个降低至了现今的995个)和错误。因为GRCh38是20位匿名志愿者的混合样本,所以并不代表单个个体的人类基因组。2021年,T2T联盟利用最新的长读长技术与自主研发的生信算法组装出了高质量端粒到端粒的参考基因组CHM13(首个人类基因组完成图)。由于它来源于一个带有重复基因的葡萄胎细胞系,因而几乎是纯合基因组。在组装难度上,纯合基因组比二倍体基因组组装相对较低。为了解决这些原有人类基因组序列的局限性,研究团队成立了人类泛参考基因组联盟(Human Pangenome Reference Consortium,HPRC)。该联盟旨在整合高质量、低成本、二倍体人类基因组,用以构建代表人类遗传多样性的人类泛参考基因组。

人类泛参考基因组联盟使用的是二倍体基因组,组装难度会更高。在样本选择上,选择了广泛使用的HG002的永生化淋巴细胞GM24385,用于ONT测序和Bionano光学图谱测序。二代illumina测序和PB测序数据使用的样本是由大量GM24385细胞而来的NIST标准样本8391 DNA样本。父系样本HG003和母系样本HG004分别来源于公开的GM24149和GM14143细胞系,并通过二代illumina测序对NIST标准样本8392(含HG002、HG003和HG004)的DNA进行测序。

组装策略及结果

本文是以HPRC的名义发表的首篇文章,该文章确定了当前基因组测序和automated组装方法的组合可以在人工干预最少的情况下产生最完整、最准确和最经济的二倍体基因组组装。在组装过程中,团队选择了最优的高精度长读长reads和父母本及子代数据进行单倍体分型组装(trio-based assembles)的方法。第一个高质量二倍体人类参考基因组(XY型),平均每条染色体仅有~4个Gaps(范围在0-12),大多数染色体长度和CHM13相比仅有±1%的差异。将近四分之一的蛋白编码基因在单倍型间存在同义氨基酸变化,而其中着丝粒区域变异的密集度最高。该研究为构建涵盖从单个核苷酸到大型结构重排的所有遗传变异的人类泛参考基因组奠定了基础。

测序及组装方法的测试总结

HPRC Trio pipeline v1.0组装流程图

小结

使用目前已有的方法和技术,研究者们可将二倍体HG002基因组的组装达到整体完整度的98.5%。利用这些方法组装不同的二倍体人类基因组,构建人类泛参考基因组,将会更全面地了解人类遗传多样性,提高精准医疗的准确性,并对生物基因组学有更深入的了解。

美国学者Erich D. Jarvis为论文的第一作者,中南大学王建新团队、中山医眼科肖传乐团队、中国农科院阮珏团队、昆明动物所张国捷团队以及华大基因杨琛涛团队均参与该项项目研究。

希望组一直致力于推动各个物种基因组完成图的组装及应用。近期还为动植物基因组完成组量身定制包含测序及组装在内的全套解决方案,敬请期待!

原文链接:https://doi.org/10.1101/2022.03.06.483034

PJ | 中南林科大、华中农大等联合破译狭叶油茶基因组,为解析油茶自交不亲和、油脂合成等重要性状的形成与调控提供重要参考

2022年3月20日,中南林业科技大学袁德义/张琳油茶科研创新团队,联合华中农业大学金双侠课题组等单位,在经典的国际植物学TOP期刊The Plant Journal上发表了题为“Chromosome-level genome of Camellia lanceoleosa provides a valuable resource for understanding genome evolution and self-incompatibility”的研究论文。希望组在本文章中提供了基因组测序及Hi-C测序服务!

油茶是我国重要的木本食用油料树种,在推进地方经济绿色增长、维护国家食用油安全和乡村振兴中占有十分重要的地位。茶油中不饱和脂肪酸含量达90%以上,还含有丰富的角鲨烯、维生素E、谷甾醇等物质,具有软化血管、降低血脂和血压的作用,是目前国内外最优质的植物食用油。目前,油茶主栽品种主要为多倍体的普通油茶(Camellia oleifera),由于油茶基因组大且亚基因组间的同源异源构成非常复杂,使得多倍体油茶基因组的解析非常困难,严重阻碍了油茶的分子遗传改良。狭叶油茶(Camellia lanceoleosa)是油茶组唯一的二倍体野生种,和多倍体普通油茶亲缘关系最近,破译狭叶油茶基因组不仅可以深入挖掘油茶资源中的优异性状,而且为油茶重要功能基因挖掘利用奠定了坚实基础,使得油茶育种不再是盲人摸象,从而开启了油茶分子育种育种时代。

研究团队利用三代Nanopore、二代Illumina和HIC技术,获得了狭叶油茶(2n=30)高质量染色体水平基因组。基因组大小约为3.00 Gb,杂合率高达2.2%,91.85%的序列被挂载到15条染色体上,共注释到54,172个基因。狭叶油茶重复序列占基因组的80.63%,其中转座子占比78.53%。深入分析发现,长末端反转录转座子家族长期而缓慢的扩增及在过去2百万年内的爆发式扩张,加之缺少快速有效的DNA删除机制,最终导致狭叶油茶基因组变得庞大。狭叶油茶与茶叶均为山茶科山茶属二倍体植物。比较基因组研究发现,狭叶油茶与茶叶共享最近的一次WGD事件,并在6-7百万年前发生分化,2号和11号染色体在狭叶油茶与茶叶间存在较大的倒位,这可能是油茶和茶叶在基因组结构上的一个重要变异。

图1 狭叶油茶基因组的组装

图2 狭叶油茶转座子的插入与移除

图3 狭叶油茶比较基因组分析

基于狭叶油茶基因组,结合GC_MS以及转录组分析,发现油脂合成的关键基因ACC的扩张及DGAT、GPD、SAD在种子的偏向性表达是狭叶油茶高油脂和高油酸含量的重要原因。儿茶素、茶氨酸、咖啡碱是茶叶品质的重要组成成分,基于UPLC-MS/MS技术的代谢组检测到狭叶油茶叶片也富含儿茶素和茶氨酸,而咖啡碱主要富集在种皮和根中,多组学分析结果表明,SAM-dependent N-methyltransferases与咖啡碱的积累与分布密切相关。细胞学分析显示,狭叶油茶也是后期自交不亲和植物。结合亲和性相关基因的表达、结构特征及染色体定位,解析了狭叶油茶的自交不亲和性特征。狭叶油茶的油脂含量、脂肪酸比例以及次生代谢物分布与含量都与普通油茶类似,以上性状的解析为理解普通油茶油脂合成等重要经济性状的形成与调控提供了重要参考。

图4 狭叶油茶自交不亲和特征解析

中南林业科技大学龚文芳副教授、肖诗鑫讲师及在读硕士生王林凯为论文共同第一作者,中南林业科技大学袁德义教授、张琳教授和华中农业大学金双侠教授为论文共同通讯作者,黄冈师范学院朱华国教授、胡孝明教授及中国农业科学院农业基因组研究所廖振阳博士后也参与了本项研究。本研究得到了国家重点研发计划项目(2018YFD1000603)、湖南省自然科学基金(2020JJ5968)的联合资助。

原文链接:

https://onlinelibrary.wiley.com/doi/epdf/10.1111/tpj.15739

技术突破丨希望组“10X+ONT-Q20+”长读长单细胞测序实测通过!!!

2021年ONT在科研团体大会(Nanopore Community Meeting)上发布了”Q20+”试剂产品。这是利用包含最新“Q20+”化学试剂并支持“双链”(Duplex)测序的新试剂盒LSK112和最新芯片R10.4相结合的测序技术,可以实现>99%的原始reads(单链)准确度,或约Q30的双链(Duplex)准确度。

希望组(GrandOmics)作为中国最早开展ONT测序服务的公司之一,一直走在技术应用的前沿,率先将高通量单细胞分选平台10X和ONT最新技术进行组合创新,给火热的单细胞测序领域,提供了全新的技术解决方案。

测试背景

2020年8月于Nature Communication杂志发表的题为“High throughput, error corrected Nanopore single cell transcriptome sequencing”的研究论文,将单细胞与Nanopore全长转录组进行了技术整合,使得在单细胞水平上检测差异RNA剪接和RNA编辑成为可能。利用Illumina对10X Genomics文库进行短读长测序,为每个基因和基因组区域定义相关的Cell Barcode,随后为每个细胞、基因或基因组区域定义相关的UMIs组合。进而利用上述信息指导Cell Barcode和UMI分配到已比对至基因组上的Nanopore reads,通过对相同UMI的reads进行分组,校正和拆分Nanopore测序reads,用于开展下游的isform分析和RNA编辑。考虑到ONT-Q20+测序即将成为行业新的长读长测序技术标准,我们迫不及待的进行了新的尝试。

测试方式

10X单细胞平台获得的全长cDNA分成两份,一份进行常规二代测序,另外一份进ONT Q20+R10.4测序,利用二代测序数据的UMI指导进行 ONT测序的数据拆分。

测试样本

某人类PBMC样本,采用最新GPU进行Super高精准度Basecalling。尽管大大提高了计算消耗,但预期可以得到最佳的单碱基质量。

测试结果

一、下机数据统计

下机数据质控统计表

Reads长度分布图

单张测序芯片的产量为36.7Gb,pass产量为29Gb。尽管产量仍有提升空间,但通过芯片及算法的升级,basecalling的准确度有了大幅度的提升,reads平均分可达到15.98,最终获得了20 Mb的reads进行下游分析,和其他长读长平台所产生的reads数相比,有着明显的产量优势。该芯片样本为单链测序样本,相信在”Duplex”的模式下,样本的测序准确度会有更进一步的提升。

2. 与参考基因组比对identity

左图Q20+R10.4的比对identity分布图,右图为LSK110 R9芯片的比对identity分布图

从图中可以发现,同个样本不同的测序试剂和芯片,对于最终比对identity的准确性有着显著的差异。LSK110 R9 base-calling fast模式的比对identity中位值在87.1%,Q20+R10.4的比对identity中位值达到了97.9%。整体数据的准确度有了明显的提升。

3.数据分解率

随着数据准确性的不断提高,利用二代UMI数据指导拆分三代全长转录组数据的比例也会有相应的提升空间,内部数据表明二代UMI数据指导拆分三代全长转录组数据的拆分率可达70%,远远高于Nature Communication文章里50%的拆分率。相信在“Duplex”模式下的数据表现会有更加亮眼。敬请关注希望组后续的相关报道!

当10x单细胞样本遇上Oxford Nanopore Q20试剂及R10.4芯片,有效提升UMI的数据拆分率,拥有更多有效数据进行下游分析。尽管“Q20+”目前处于试测阶段,但相信未来在基因组、转录组上的应用场景会不断增加。希望组早在2020年年底已经推出了利用纳米孔平台进行单细胞全长转录组的产品SCAN-seq。现在有了Q20试剂的加持,拓宽了单细胞全长转录组的应用场景和需求,可以为广大科研工作者提供更好、更优质、更前沿的技术!

项目文章丨PNAS封面!李家堂团队等揭示“飞蛙”滑翔的遗传机制

近日,中国科学院成都生物研究所李家堂研究团队等以云南西双版纳地区的“飞蛙”——黑蹼树蛙为研究对象,通过多维度研究手段,阐明了其攀爬和滑翔行为相关表型的遗传机制。相关研究在《美国科学院院刊》以封面论文形式发表。希望组在本研究中提供了三代测序组装、注释以及Hi-C测序、挂载服务。

动物复杂性状是动物长期适应演化的结果,是动物多样性形成的重要基础。自然界物种采取各种各样的进化策略以适应不同的栖息地,如高原、海洋、荒漠等。部分类群通过演化出了特殊的表型以适应树栖生活。树栖生活拓展了这些物种对垂直空间资源的利用,有助于它们躲避天敌,获取丰富的食物资源等。但森林环境复杂的立体结构也对动物的运动能力提出了严苛的要求。

在白垩纪末期大规模物种灭绝事件后,无尾目多个科的物种独立演化出了攀爬和滑翔的相关表型,并成功拓殖树栖生态位,黑蹼树蛙就是其中的代表性物种。黑蹼树蛙隶属于树蛙科,常年生活在热带雨林树冠层,是典型的树栖蛙类。据报道,其最高栖息高度达57米,为目前树栖蛙类停留高度的最高记录。黑蹼树蛙具有强大的滑翔能力,因此又被称为“飞蛙”,为揭开两栖动物树栖适应之谜提供了良好的动物模型。

 黑蹼树蛙,饶涛绘

近日,中国科学院成都生物研究所李家堂研究团队等以云南西双版纳地区的“飞蛙”——黑蹼树蛙为研究对象,通过多维度研究手段,阐明了与攀爬和滑翔行为相关表型的遗传机制。

研究团队选择了蹼发达的黑蹼树蛙(满蹼)和宝兴树蛙(微蹼)开展行为学实验。研究人员分别设置了1,1.5和2米的高台,让两种树蛙分别落下并记录运动轨迹。

结果发现
黑蹼树蛙在下降过程中会尽力撑开四肢,依靠满蹼维持空气动力学平衡,使其身体与水平面夹角始终小于宝兴树蛙。而宝兴树蛙则更像是在“跳楼”。这一结果提示树蛙的蹼在滑翔过程中起到重要作用,是支撑滑翔行为的重要性状。

两种树蛙形态学比较与行为学实验

两种树蛙蝌蚪发育时期的肢体形态学比较提示两者之间存在不同的发育模式。以两种树蛙高质量基因组为基础,结合蝌蚪四肢发育过程中的转录组数据,通过时序基因共表达网络分析,发现黑蹼树蛙蝌蚪肢体在发育阶段特异共表达一系列与Wnt信号通路和血管重构相关的基因。这种发育时期特异表达模式可能通过参与指和指间区域生长速率的调控对蹼足的形成起到关键作用。

两种树蛙蝌蚪肢体发育过程形态学比较与时序基因共表达网络分析

树蛙中调控角蛋白和细胞骨架形成的PPL基因受到正选择,且存在树蛙属内保守的氨基酸替换,这可能有助于树蛙攀爬相关性状——吸盘的形成。壁虎的刚毛主要由β角蛋白扩张形成,而树蛙指/趾尖吸盘的主要结构蛋白为α角蛋白,而α角蛋白同样是哺乳动物和人类毛发纤维最主要的成分之一。

“这些祖先角蛋白可能在早期四足动物需要皮肤强化的区域中表达,而随后分化为支持两栖动物和哺乳动物不同的适应性结构”。

本研究通过前期大量的野外观察,整合形态学、行为学和组学等学科研究手段,系统解析了“飞蛙”滑翔的遗传机制,为人类认识动物有趣行为提供新的视角,对动物特殊功能的仿生研究及人类并指症等相关疾病的防治有重要基础科学价值。

该研究成果以“Genomic adaptations for arboreal locomotion in Asian flying treefrogs”为题在《美国科学院院刊》以封面论文形式发表(点击左下角阅读原文)。本研究得到中国科学院B类先导科技专项、国家自然科学基金等项目的资助。