武汉未来组凭第三代测序项目荣获“华创杯”评分并列第一

第三届“华创杯”创业大赛决赛于2016年6月21日在武汉光谷金盾大酒店举行。未来组本次创业项目“高通量测序的临床检测与诊断”获得评分并列第一,荣获本次大赛二等奖。

“华创杯”是依托华侨华人创业发展洽谈会(华创会)的大型创新创业赛事活动,第三届“华创杯”自今年3月启动报名以来,吸引了广泛关注,收到来自18个国家的365个有效报名项目,涉及新材料新能源、IT、光电子、TMT、生物医药、文化传媒等多领域。

武汉未来组生物科技有限公司是中国三代测序服务公司,致力于将第三代测序技术运用于农业生物和医学遗传病等研究中。决赛演讲中,未来组CEO汪德鹏先生向大家展示了未来组运用第三代测序技术在农业生物领域中的成果,以及在遗传病诊断中的项目积累。

第三代测序仪Sequel已正式启用

未来组Sequel已经就绪,我们正式揭开了它的神秘面纱:

Sequel测序仪是PacBio公司发布的最新的SMRT 测序仪器,与SMRT RSⅡ平台相比,具有很多优势:

通量更高,每个Cell有100万个ZWMs,通量提升了7倍;

体积更小,比想象的更mini,Sequel体积缩小到SMRT RSⅡ的三分之一;

成本更低,测序成本大大降低,配上最新版本的建库测序试剂,给广大科研学者们带来性价比更高的数据。

揭开庐山真面目

当然,仅仅是性能优越的仪器是无法满足高质量的基因组研究需求的,那么到底是什么能让我们在三代测序领域带来各种出色的三代产品呢?这里不只有Sequel,组学君带你来数一数这里的各种干货:

丰富的三代基因组组装经验

未来组自2011年成立以来,完成了涵盖微生物小基因组、动植物大基因组等各种大小300多个项目的纯三代基因组项目,积累了丰富的基因组组装经验。

优秀的三代信息分析团队

信息分析团队通过四年多来各种大小基因组项目的实战磨练,加上不断的创新积累,开发出了自己的组装流程,攻克各种大基因组(>10G)、多倍体基因组(四倍体、六倍体)组装等难题。

未来组具有全面的信息分析能力,覆盖了基于三代测序的各类大小基因组组装、基因组重测序、全长转录组、全基因组甲基化及富集甲基化、群体微生物研究等各种基因组学科研服务产品。对于这些产品,组学君将陆续为大家庖丁解牛。

中国科学家正式启动萤火虫基因组测序项目

2016年4月29日,中国最权威的萤火虫自然保护研究中心——守望萤火中国三代测序服务公司——武汉未来组,联合启动对中国最美丽的萤火虫——穹宇萤进行基因组测序和群体基因组学研究。依托守望萤火研究中心多年的物种保护和研究经验,对穹宇萤基因组进行深度测序,将有助于我们理解这种萤火虫独特的闪光求偶行为。

穹宇萤是我国独有的珍稀半水栖萤火虫,也是最美的萤火虫,雄萤栖息在藤蔓上,以一秒八次闪光频率进行同步发光,向飞行的雌萤求偶。话说其他种类萤火虫都是俊男在空中闪光走猫步,为啥穹宇萤男士们撩妹这么含蓄?这项研究也有利于我国萤火虫生物多样性的保护。为了保护萤火虫,@寻萤者付新华和@守望萤火也是拼啦。

守望萤火研究中心是由华中农业大学付新华副教授在SEE基金会创绿家项目的资助下,成立的内地首家萤火虫研究机构,致力于萤火虫的保护和研究。通过开展萤火虫自然教育,引导公众认知、热爱萤火虫,提高公众对萤火虫的保护意识,促使公众的环保意识深化为环保行动;积极推进萤火虫栖息地的保护及修复,倡导科学赏萤。

武汉未来组作为中国三代测序技术应用的领导者,已经具有5年的三代测序技术开发经验,累计完成500多个三代测序科研项目,在大基因组(大于3G)、复杂基因组(重复序列高于50%以上)以及多倍体(四倍体、六倍体)组装积累了丰富的经验,三代测序文章发表数位居国内第一。2016年3月,又率先引进了3台Pacific Biosciences公司最新推出的三代测序旗舰平台——Sequel。Sequel平台在PacBio RS II的基础上作了全面系统地升级,在读长、通量和准确率等方面都具有显著优势,升级后的系统,更加符合大数据量、多倍体以及复杂基因组学研究的需求。

引进Sequel测序平台,未来组继续领跑三代测序服务市场

武汉未来组今天正式宣布引进最新的美国三代测序平台Sequel,借助于独家开发的基于“天河二号”平台的三代测序基因组组装流程,未来组即将提供“一周一个动植物基因组”的特色服务。

2016年1月21日,三代测序服务公司武汉未来组与美国PacBio公司在中国的独家代理商基因公司顺利签约引进了Sequel测序仪。根据协议,未来组将引进至少3台最新的PacBio公司的三代测序平台Sequel,以满足呈指数增长的三代测序服务需求,从而继续领跑中国三代测序服务市场。这是未来组在采用“天河二号”超级计算机,顺利解决高度复杂动植物基因组组装问题之后,又一次进行技术平台的升级,以实现未来组构建中国有影响力的三代测序平台的战略目标。

本次引进的三代测序平台,包含3台Sequel测序仪及其附属配套仪器与软硬件,将部署在武汉光谷生物城的未来组生产研发中心,面积超过1000平方米,采用10万级洁净实验室,以确保生产过程中达到最高的环境标准,从而确保最高的测序质量。

与PacBio RS II平台相比,Sequel测序平台虽然体积只有约1/3,测序通量却提高了7倍。目前每台测序仪的通量超过8000Gb/年,相当于每年大约可以完成100个动植物基因组的测序(按1Gb估算)。目前,武汉未来组已经开始接受新测序平台的服务预定,在优先保证老客户使用的前提下,公司还将优先支持高度复杂的动植物基因组项目、人类基因组测序项目、复杂微生物组测序项目等领域。同时,该Sequel测序平台也将提供给兄弟公司北京希望组用于精准医疗方面的前瞻性科学研究,成为将三代测序用于医疗健康领域的机构。

关于第三代测序技术

第三代测序技术也称为单分子实时测序技术。美国Pacific Biosciences公司是目前正式商业化的第三代测序仪厂商,已在很大范围内为多个基因组学中心提供PacBio RS II测序仪,并于2015年10月推出新产品Sequel测序仪。PacBio测序具有超长读长(平均读长10-15Kb,最长读长可超过40Kb)、无PCR扩增偏差的单分子测序、直接分析碱基修饰等技术优势,已经快速应用于基因组de novo组装、转录组学研究等领域,随着性价比的不断提高,第三代测序技术将在未来的2-3年内快速普及。

组学君喊你来看榜—2015年三代测序基因组文章

随着后基因组时代的到来,研究者的目光转向了功能基因组、比较基因组、进化基因组等领域的研究。此时Draft genome中组装顺序、重复区gap、染色体结构变异区的组装错误等成为了后基因组研究的瓶颈,这个时候迫切需求对draft genome升级及高质量参考基因组的获得。通过过去几年PacBio技术的发展,已能得到微生物基因组完成图(真菌基因组近完成图),解决微生物领域大量问题,更参与了大型基因组的升级和de novo组装,为动植物基因组领域研究添砖加瓦。组学君盘点了2015年PacBio技术在大型基因组升级和de novo组装中的“杰出贡献”,此处应该有掌声!

01  PacBio SMRT 测序解决人类基因组复杂序列难题

2015-1-29 Nature

研究策略:PacBio RS Ⅱ P5C3(41×)

作为目前最完整的哺乳动物基因组参考序列,人类基因组经过十几年的不断完善,仍然存在160多个gap。人类基因组中的结构变异等复杂信息仍知之甚少。在这篇文章中,研究人员利用PacBio测序,成功填补了GRCh37上55%的gap,其中包括78%的短串联重复序列,存在于高GC基因组区域;确定了26,079个常染色质结构变异,包括染色体倒置、复杂插入片段及大量长串联重复,大部分变异之前未曾报道过。这篇文章的发表,令人类基因组的完整性得到了重要提升。

02  果蝇Y染色体新基因的发现

拨开假基因、转座子和高度重复序列的云雾

2015-8-21 PNAS

研究材料:黑腹果蝇 Drosophila melanogaster

研究策略:基于黑腹果蝇基因组 NCBI accession JSAE00000000.1 数据进行MHAP, PBcR, FALCON, Illumina reads 验证组装结果

与哺乳动物性染色体同源模式不同,果蝇的XY染色体并不同源,大多数Y连锁基因是常染色体旁系同源基因,因此,果蝇Y连锁基因主要来源于常染色体的转移。研究人员利用已有的PacBio测序数据研究了黑腹果蝇Y染色体中一段复杂区域,发现之前未确定的基因FDY,这个基因所在的区域有55 kb,含有假基因、转座子和高度重复序列。FDY来源于常染色体基因vig2的近期复制,能为早期阶段果蝇Y连锁基因的建立提供信息,同时论证了果蝇Y染色体如何积累常染色体基因。研究人员在文章中说:“PacBio技术解决了腹黑果蝇复杂区域的难题,得到几乎无错的FDY区域组装,这是我们曾经耗费大量工作也未能解决的难题”。

03  扁虫为何可以再生

一个重复度极高的复杂基因组

2015-8-23 PNAS

研究材料:扁虫 Macrostomum lignano

研究策略:基因组1. PacBio RS Ⅱ P4C2(130×)  2.Hiseq 2000 (170×);

转录组 Hiseq 2000

扁虫有着令人惊叹的再生能力,受伤之后可以产生大量的躯干干细胞群——即副胚层——再生出几乎完整的新机体。这一独特性质吸引了大量学者来研究扁虫进化机制,如组织自我更新、细胞特异性、细胞再生等。由于之前已经发布的基因组参考序列有许多gap和注释不完整,功能研究受到极大限制。但是扁虫基因组极为复杂,约75%的基因由简单重复序列和转座子序列组成,利用NGS短读长得到的组装结果很不理想(contig N50 = 222 bp)。因此研究人员利用130×PacBio 长读长数据获得了更好的组装结果(contig N50 = 64 kb)。在此基础上,结合转录组分析和功能实验等,研究人员对干细胞功能相关的细胞信号通路进入了深入研究。

04  耐旱草

复杂基因组元件蕴藏着什么样的宝贵信息?

2015.11.11 Nature

研究材料:耐旱草 Oropetium thomaeum

研究策略:纯三代组装 (72X)

一个精细组装的大基因组参考序列,是挖掘复杂基因组元件功能的基本前提。Donald Danforth植物科学中心的研究人员及其合作者运用三代PacBio RSⅡ测序平台,以72倍的覆盖度分析了Oropetium 245 Mb的基因组,组装得到近乎完整的基因组参考序列(Contig N50=2.4Mb),并且准确性超过99.999%,检测到很多之前二代测序无法组装的区域,包含端粒和着丝粒序列、长末端重复反转录转座子、串联重复基因以及其他难以接近的基因组元件,发现了大量与耐旱相关的基因组元件,对其耐旱分子机制有了更深入的理解。

05  赤小豆基因组

多种基因组组装策略之横向比较

2015.11.30 Nature Scientific Reports

研究材料:赤小豆 Vigna angularis

研究策略:Assembly_1,Roche454和Illumina数据混合de novo组装;Assembly_2 ,Illumina-only de novo组装;Assembly_3 ,PacBio de novo组装;通过小豆 V. angularis cv. ‘Erimoshouzu’ (JP37752) 与V. nepalensis (JP107881) 的F2构建高密度遗传连锁图,辅助优化组装结果。

赤小豆是东亚第二重要的豆类作物品种,目前赤小豆主要的培育方向是种子质量、耐寒能力及抗病性能。文章中比较了赤小豆基因组组装中的三种策略——基本代表了目前主要的de novo组装方法。从组装结果来看,纯三代组装方法能够明显提升组装结果。

你知道吗?一张图可以看懂DNA测序平台的发展哦!

近几十年来基因组学高速发展,我们目睹了新的技术不断问世。从第一代Sanger测序到基于PCR扩增的二代NGS,再到单分子测序;也见证了新的仪器接踵而至,从ABI的第一台Sanger测序仪,到后来Roche的454,Illumina,Solid,以及Nanopore,PacBio SMRT单分子测序仪。回顾2015,笑看NGS发展风云史,是一家独大的笑傲江湖,还是长江后浪推前浪的前赴后继?展望2016,是旧时代的延伸,还是新技术的披荆斩棘?组学君携新一代测序仪与你一起回顾NGS技术发展。

武汉未来组助阵2015 PAG ASIA 新一代大基因组组装策略反响热烈

2015年7月13~15日,亚洲动植物基因组大会(Plant and Animal Genome Asia 2015)在新加坡举行,这是PAG在亚洲的第三届大会,邀请亚太各国的三十多位动植物基因组学权威学者向约300名与会者介绍了各自的最新进展。与此同时,会议主办方还邀请了数位来自欧美相关领域的特邀嘉宾参与学术交流。

作为中国首家提供三代测序服务的公司,未来组以赞助合作方的身份在此次基因组学盛会中向现场的国内外学者展示了自己的研发成果,包括基于PacBio平台的大基因组组装、全长转录组分析等研究策略, 未来组的生信分析团队还与各国学者深入探讨了PacBio技术在组学研究中的具体思路,引起现场热烈反响。

无独有偶,许多与会主讲人都在自己的报告中展示了PacBio数据分析如何提升基因组组装指标,并与过去传统的第二代高通量测序数据进行比较,充分证明了第三代单分子测序技术的巨大潜力。随着PacBio测序耗材的不断升级,测序读长更长,产量更高,大基因组de novo组装已经进入新阶段,甚至连过去已经发布的许多物种基因组参考序列都获得了进一步完善,为未来的功能基因研究、遗传育种应用等后续研究打下坚实基础。未来组不但在国内率先将PacBio技术应用于组学研究,更在过去的三年多时间内积累了大量实践经验,成为基于第三代测序技术之基因组学研究的首选合作伙伴。

HLA分型 & MinION (三代测序那些事儿 第十一期)

MinION Acess Program(MAP)2014-

这期接着聊MinION,还不知道MinION为何物的小伙伴可以阅读小编的上一期文章或者访问Oxford Nanopore官网:www.nanoporetech.com

Oxford Nanopore 2014年面向全球推出了其三代测序系统MinION的试用计划(MinIon Access Program),申请者只需支付1000美元便可得到MinION及其配套的建库试剂盒、在线分析软件等,Nanopore可根据反馈数据进一步完善其MinION系统。

这种全球性的知识众筹行为让Nanopore在短短一年里获得了大量的专业经验, 目前MAP计划已经产生了20多篇研究成果,涵盖了数据处理[1]、致病菌/病毒鉴定[2-3]、基因组组装[4-6]、Isoform 测序[7]、HLA分型[8]等众多组学研究热点,这对Nanopore来说算得上钵盆满盈。

PS:目前试用计划只支持DNA片段测序文库。

上期三代那些事儿里小编为大家分享的是MAP计划中分别来自法国(Institut de Génomique)、英国(伯明翰大学)、美国(冷泉港)的研究团队的几个微生物基因组MinION数据组装成果,展示出该超长读取的新型测序技术已经初步具备了快速绘制微生物基因组完成图的能力。

MinION在HLA分型中的首次尝试[8]

这期分享的是来自加拿大多伦多大学的一篇研究(MAP计划成果),研究中Ron等人尝试使用MinION数据实现对HLA-A、HLA-B的高分辨率分型,即等位基因(Alle)级别的四位数分辨率(4-digit resolution)。

HLA中文名为白细胞表面抗原,对抗原呈递和免疫信号传递起关键作用,是人体中最复杂的遗传多态系统,同时等位基因具有共显性表达的特点,截止2015年4月,IMGT/HLA数据库中收录了36个HLA基因座位,Alle数目高达13,023个。

HLA的高分辨率(等位基因级别)分型对于器官移植、精确用药(比如用于治疗HIV/AIDS的嘌呤醇、阿巴卡韦等)至关重要。

基于NGS的PCR-SBT法是目前主流的HLA分型方法,但由于其读长较短往往难以得到Alle级别的高分辨率分型结果,借助双亲数据以及HapMAP单体型(注意区分单倍体型)数据Phasing得到的高分辨率结果通常存在较大的误差。

研究中使用MinION装置对个体NA12878(CEPH/Utah Pedigree 1463)的HLA-A、HLA-B扩增子进行了测序,使用了R7.3新型试剂,经所测数据比对回人类参考基因组GRch37上,每个基因座位得到了~1000 X MinION 2D Reads,准确率在70-90%,长度大多为4-5kb(见图1),代表了大多数reads包含了完整的HLA基因(HLA-A、HLA-B基因5kb左右)。

                   图1 Reads(Blasr mapping to GRch37)长度分布

使用HLA GATK HLA Caller 预测了基于上述MinION数据的HLA-A、HLA-B基因型,得到高分辨率的等位基因型预测结果:

HLA-A Alle 1 *01:32 、HLA-A Alle 2*03:12;
HLA-B1 Alle 1*07:56、HLA-B Alle 2* 55:10。

然而,使用NGS、飞行质谱等数据,借助HapMAP 单体型数据校正,却得到了与上述相差较大的等位基因分型结果:

HLA-A Alle 1 *01:01 、HLA-A Alle 2*11:01;
HLA-B1 Alle 1*08:01、HLA-B Alle 2* 56:01。

从四位数分辨率的分型结果来看,较高原始错误率的MinION数据似乎并不能马上胜任HLA的临床分型。

但小编相信随着原始错误率的降低以及分型算法的改进,MinION会成为一款应用于HLA临床分型的便携式装置。

另一种也是目前唯一商业化的三代测序技术的PacBio SMRT已经在HLA分型中做了较为成功的尝试,英国安东尼诺兰研究所使用该技术对7个个体中的HLA-A、HLA-B、HLA-C基因进行了分型,共得到38个等位基因型,大多数达到了六位数级别的超高分辨率,其中30个与IMGT/HLA数据库中收录的基因型完全相符,见表格2[9]

Paper:
[1] Poretools: a toolkit for analyzing nanopore sequence data .
[2] MinION nanopore sequencing identifies the position and structure of a bacterial antibiotic resistance island.
[3] Bacterial and viral identification and differentiation by amplicon sequencing on the MinIONT nanopore sequencer
[4] A complete bacterial genome assembled de novo using only nanopore sequencing data.
[5] Genome assembly using Nanopore-guided long and error-free DNA reads.
[6] Oxford Nanopore Sequencing and de novo Assembly of a Eukaryotic Genome
[7] Determining Exon Connectivity in Complex mRNAs by Nanopore Sequencing
[8] Long read nanopore sequencing for detection of HLA and CYP2D6 variants and haplotypes
[9] HLA Typing for the next Generation.

逆境中求生存的MinION君(三代测序那些事儿 第十期)

原创文章  作者 贺少方

三代测序那些事儿开贴以来一直是在讲三代测序君PacBio的发家史,其实三代测序这个行当里还有另外一位仁兄Oxford Nanopore,一直被大家忽略却也是蛮拼的一个家伙。小编今天就换个口味,给大家聊聊Nanopore MinION君是怎么逆境中求生存的。

Oxford Nanopore 2014年推出其掌上测序仪MinION试用计划,同样具有单分子测序与超长读取能力,摒弃了边合成边测序的设计思想,采用单条核酸链中不同碱基通过蛋白纳米孔是产生的电流变化来标定碱基顺序,这一独具匠心的设计造就了其U盘大小的体积、多种大分子(蛋白质、RNA、DNA)通吃、单分子超长读取等诸多特殊能力[1]

之后其30%的原始错误率饱受诟病,这其中就包括其首批试用用户伯明翰大学的Nick Loman,他首次试用后发现λ噬菌体的MinION数据因为较高的原始错误率仅有25%可以mapping回参考基因组,表示不好用。

但是短短一年时间里,MinION似乎找到了突破这一窘境的办法,测了埃博拉、分了HLA、装了基因组(酿酒酵母、不动杆菌、大肠杆菌),显示了自己在测序领域中的三代地位[2-5]

小编分析了上述提到的那几个MinION基因组的案例,发现MinION君确实是从PacBio君身上学到了不少东西,虽然两位在测序原理上是天差地别,但所产数据类型很相似的,读取很长(平均读长数Kb级别),原始错误率略高,而学到的主要的东西还是对原始reads的比对、校正思路、算法等,这些帮助了MinION慢慢脱贫致富,以下搜集的两组案例说明了这个问题。

E.coli K12 的纯MinION数据组装

最近(2015年2月)放在冷泉港预印本网站bioRxiv上的一篇单独使用MinION数据组装大肠杆菌E.coli K12基因组到完成图级别的文章便是一个很好的例子,比较巧的是这篇文章的作者便是文章第三段提到的那个嫌弃MinION不准的那个伯明翰大学的Nick Loman教授。

Nick Loman使用了21X的MinION 2D  reads(4 MinION Runs,平均读长~8kb)对E.coli K12的基因组装。DNA链的先导链和滞后链均被测到所产生的reads称为2D (two-Direction)reads,约占总数据的25%。 相较于普通的reads具有更高的准确率,结合新型试剂测序R7.3以及新型的base caller可以使2D reads准确率达到78%-85%,略低于PacBio的85%。

E.coli K12的组装过程也采取了类似于PacBIO组装过程中的先校正后组装的思路。校正过程中采用的DALIGNER比对算法、pbdagcon一致性算法均是之前针对PacBio数据所开发的,最后使用OLC算法的Celera Assembler对校正后的数据(准确度97.7%)进行了组装。

组装得到1条4.6M的contig,基本达到了完成图级别,与E.coli K12参考基因组相比,单碱基准确率为98.4%,有两处组装错误。

这一组装结果已经确实已经显示出了MinION在细菌完成图组装中的优秀性能,准确率方面的问题相信通过后期试剂、算法的更新会有较大的改善。

基于MinION数据的混合组装(不动杆菌 & 酿酒酵母)

除过大肠杆菌E.coli K12的纯MinION三代数据组装,MinION君之前也通过二三代数据混合组装的方式在不动杆菌A. baylyi 与 酿酒酵母S.cerevisiae中进行过尝试。

不动杆菌A. baylyi的二三代混合组装过程使用了23X的MinION数据与50X的illumina数据,利用针对MinION的新型组装算法NaS最终组装得到3条Contig,最后利用MinION数据使用SSPACE做Scaffolding,最终得到1条Scaffold。

酿酒酵母的二三代数据组装过程使用了121X的MinION数据,若干Miseq数据, 采用针对PacBio的PBcR思路进行组装,不过数据校正过程中使用到的比对算法为针对MinION开发的新型比对算法Nanocorr,一致性算法为HGAP中的pbdagcon,最后组装得到的ContigN50 为479kb,单碱基准确率99%以上。

最后,对于 MinION君的前途,不管你看不看好,反正我很看好。

Paper:

[1] Bayley H et al. Nanopore sequencing : from imagination to reality. Clin Chem.  2015

[2] Nicholas J. L et al. A complete bacterial genome assemble de novo using only nanopore sequencing data. bioRxiv . 2015

[3] Madoui MA et al. Genome assembly using Nanopore-guided long and error-free DNA reads. BMC Genomics. 2015 .

[4] Oxford Nanopore Sequencing and de novo Assembly of a Eukaryotic Genome. bioRxiv. 2015

[5] Ron Ammar et al. Long read nanopore sequencing for detection of HLA and CYP2D6 variants and haplotypes. F1000Res . 2015

声明:本文原创,转载请注明来源 。

一项基于PacBio的目标区域测序技术:PacBio-LITS(三代测序那些事儿 第九期)

最近有很多老师询问我们是否可以用PacBio SMRT 长读取技术只对他们感兴趣的基因组区域进行测序,也就是我们常说的目标区域测序,这样一方面节约了研究成本,另一方面也是更重要的一点,解决了基于NGS(传统二代测序)的目标区域测序所遇到的基因组复杂区域的组装及结构变异检出的问题。

该技术确实是可行的,Bayler医学院已经开发了基于NimbleGen 靶向捕获富集技术的PacBio目标区域测序技PacBio-LITS, 其中NimbleGen获技术是由Roche公司开发,可以几天内捕获连续或分散的 5Mb或30Mb基因组区域。该研究成果发表在今年3月份的 BMC Genomics。

对于该技术,我们(Nextomics)还处于研发阶段,参考了贝勒医学院的PacBio-LITS技术思路,成熟产品推出可能还需要些时间,但研发期间我们欢迎合作伙伴的加入。

PacBio-LITS 解读

相关文献:

PacBio-LITS: alarge-insert targeted sequencing method for characterization of humandiseaseassociated chromosomal structural variations .

PacBio– LITS技术路线

gDNA随机打断(g-TUBE)→BluePippin分选→NimbleGen捕获→LM-PCR→PacBio建库测序。见图1

                                                                图1:PacBio – LITS workflow

PacBio-LIST技术论证

研究人员总共制备了5个NimbleGen捕获文库,来自3个个体(HS1011、BAB1123、NA12878)。

捕获过程中使用了两种类型的探针:SMS/PTLS与MHC。其中SMS/PTLS是针对 Potocki-Lupski综合征(PTLS)、Smith-Mangenis综合征(SMS)相关区域设计,捕获区域为17号染色体短臂上的一段7Mb区域。MHC为针对人类HLA基因区域设计,区域大小为4.97 Mb。

HS1011构建了一个~4kb的MHC捕获文库。

NA12878分别构建了一个~6kb的SMS/PTLS捕获文库和一个~4kb的MHC捕获文库。

PTLS个体BAB1123构建了~1kb与~4kb两个SMS/PTLS捕获文库。

使用PacBio RSII对捕获文库进行了测序,各得到~800Mb数据,使用试剂为P5C3。

对测序结果统计显示,~6kb的捕获文库(NA12878,SMS/PTLS)的捕获率最高,~73%(目标区域的reads比对率),平均subreads长度为2.4kb。其次为BAB1123 的~1kb与~4kb SMS/PTLS捕获文库,捕获率分别为69%、65%,平均subreads长度分别为2.2kb与770bp。两个MHC捕获文库捕获率较差,均为~50%。

该结果表明较大的捕获文库较长的reads长度有着更高的捕获率。

PacBio-LITS检测PTLS个体致病区域 17p 11.2 结构变异情况

研究者分别为3个PTLS个体BAB2714、BAB2695、BAB3793构建了~4kb捕获文库,使用了针对17p11.2区域的SMS/PTLS系列探针(NimbleGen),捕获区域大小为7Mb。

将测序数据比对回人类参考基因组GRCh37,利用针对PacBio数据开发的结构变异检测工具PHhoney发现了存在于BAB2714、BAB2695、BAB3793的17p11.2区域的染色体重排现象(也得到了Sanger测序结果的验证)。

其中在BAB2714与BAB3793中发生了LCR(low copy repeat)介导的倒置重排,BAB2695中发生了Alu介导的染色体重排。

声明:本文原创,转载请注明来源。