• 人体微生物组学

    精准医疗的又一个浪潮

人体微生物组——人体的第二基因组

人体是由人的细胞和所有共生微生物构成的“超级生物体”,寄生在人体体表和体腔内的微生物数量可达人体自身细胞数量的10倍以上,总重量超过1千克。人体微生物组分布于人体各个部位,其中肠道微生物数量最多、种群最丰富,约占人体微生物总重量的80%以上,数量超过100万亿个,编码基因数目约是人类基因组的100多倍。这些微生物的所有基因被统称为人体微生物组,相对人类基因组,也被称为“人体第二基因组”,在调节代谢、内分泌和免疫反应等方面发挥着重要作用。

近年来随着测序技术的不断成熟,对人体微生物组的研究如火如荼。大量研究表明,肠道微生物与消化道类疾病、代谢类疾病、免疫性疾病、精神疾病等息息相关。

扩增子测序 or 宏基因组测序?

目前肠道微生物组研究最常用的两种方法是扩增子测序和宏基因组测序。扩增子测序可以进行物种分类、物种丰度、揭示环境因子和微生物群落之间的相互关系,但是不能进行基因预测及功能注释。宏基因组测序不但能够获得环境物种组成和丰度信息,还可以对微生物群体基因组成及功能、特定环境相关的代谢通路等进行全面分析,从而深入挖掘和研究具有应用价值的功能基因。因此,在肠道微生物组学研究中,宏基因组测序可以用于新病原的发现、抗性基因的研究、疾病相关代谢研究等。

基于PacBio测序的宏基因组研究

由于受群落中大量微生物物种内和物种间重复序列双重因素的影响,宏基因组的组装比普通动植物基因组的组装难度更大,因此基于二代测序技术的宏基因组测序因读长短、不能跨越重复序列、高GC含量序列等,无法真正揭示菌群的复杂情况。

虽然宏基因组相关研究的文章非常多,已经验证了很多疾病均与肠道微生物有关。但是大部分研究的结论都只是相关性,即某种菌可能跟某种疾病有关,也有可能跟另外一种疾病有关,无法得到准确的单体型、完整的质粒,也无法完全区别菌株内部的差异性。希望组重磅推出基于PacBio测序的宏基因组研究,突破二代测序技术瓶颈,以期真正找到某种菌里面的某一个质粒或某种菌里面的某些特定基因,或者某种菌里面的某一些变异结构导致的某种疾病。

技术优势

超长读长与极低的GC偏向性

轻松覆盖微生物基因组中重复序列和异常GC含量的复杂区域,对微生物基因组进行快速组装,挖掘复杂区域的重要功能

直接检测碱基修饰

样品无需处理,直接测序即可检测出微生物基因组中4mC、6mA等多种碱基修饰

获得完整质粒图谱

对于含有质粒的细菌,在得到基因组完成图的同时,也得到完整的质粒图谱

两种研究思路

基于CCS Reads的宏基因组分析

通过对PacBio原始错误率矫正,得到2Kb的环状一致测序(Circular Consensus Sequencing,CCS) reads,准确率达到99%以上,从而较完整地覆盖大多数微生物基因或基因的特异性区域,无须组装即可进行菌群组成、功能注释和代谢通路分析。

基于PacBio组装策略的宏基因组分析

基于大片段高质量reads的PacBio组装策略,增加了来自不同微生物 reads的特异性,有效避免了不同个体reads之间的交叉组装,完整的组装出优势菌群基因组,精确还原环境中微生物组成和功能基因信息。

研究路线

建库、测序

对样本基因组DNA进行打断,构建3Kb插入片段文库,PacBio Sequel平台进行测序,每个样本建议1-2个SMRT Cell

生物信息分析

数据处理

1.去除接头序列 2. 生成CCS序列 3.数据质控  4.数据统计

基因分析

将测序所得数据进行 De novo 组装,对组装结果进行基因预测、去冗余构建肠道宏基因组参考基因集

基因功能和物种注释

通过比对公共数据库(包括 nr、Swiss-Prot、COG、KEGG、GO、CAZy、eggNOG以及 ARDB)对基因集进行注释,获取基因功能和物种注释信息

基因、功能、物种多样性分析

将 reads 比对回基因集,计算各样品的基因丰度以及物种丰度情况;基于丰度数据,可进 行物种多样性分析、PCA 分析、聚类分析、差异分析、功能富集分析等多项分析内容

疾病关联分析

疾病相关表型信息筛选,鉴定疾病相关 markers,构建分类器