未来组ONT文章||赤点石斑鱼染色体水平基因组发表

2019年7月20日福建省水产研究所与武汉未来组生物科技有限公司合作项目以“De novo Assembly of a Chromosome-Level Reference Genome of Red Spotted Grouper (Epinephelus akaara) Using Nanopore Sequencing and Hi-C”为题,发表在Molecular Ecology Resources(IF=7.049)期刊。福建省水产研究所黄种持研究员、郑乐云教授级高工,武汉未来组胡江,以及集美大学王艺磊教授为共同通讯作者,福建省水产研究所葛辉博士、林克冰研究员,武汉未来组申蜜为共同第一作者,刘雷为共同作者。该研究利用Nanopore测序和Hi-C技术获得了赤点石斑鱼染色体水平的高质量参考基因组,组装基因组大小为1.135 Gb,contig N50为5.25Mb,scaffold N50 达46.03 Mb。该高质量基因组为赤点石斑鱼的分子育种和功能基因组学研究提供了宝贵资源。同时,该研究也表明Nanopore测序产生的长读长序列可以有效提高基因组组装的连续性和完整性。

图1 文章发表信息

研究背景

赤点石斑鱼(Epinephelus akaara)属于辐鳍鱼纲(Actinopterygii)鲈形目(Perciformes)鲈亚目(Percoidei)鮨科(Serranidae),是中国、日本和东南亚最具经济价值的重要海洋鱼类之一。由于过度捕捞、食物来源减少、环境污染等导致赤点石斑鱼数量大减,已被列为濒危物种。同时,赤点石斑鱼雌雄同体,雌性先熟,是研究性别倒置,发育,遗传多样性和免疫的良好模型。但是,赤点石斑鱼分子水平的研究却有限,迄今尚未有参考基因组。

图2赤点石斑鱼

基因组组装

利用二代测序数据进行基因组调研分析,预测赤点石斑鱼基因组大小约1,111 Mb,杂合度约0.375%。利用Nanopore GridION X5测序仪对一尾成年雄性赤点石斑鱼(NCBI taxonomy ID: 215347)进行测序,过滤后获得106.29Gb的数据,read平均长度为18.35kb,readN50为26kb。采用Canu+Nanopolish+Pilon的组装策略,获得1.135Gb的基因组,与预测基因组大小相近,contig N50为5.25Mb。

为了进一步提升组装质量,研究者测序了112.83Gb的Hi-C数据,过滤后共有26294万个配对末端序列唯一映射到组装基因组的DpnII切割位点侧翼,随后利用LACHESIS软件进行聚类、排序和定向,将2,055 个contig序列挂载到24条染色体上,挂载率为95.55%,scaffoldN50 达46.03Mb(表1)。BUSCO数据库评估该基因组完整性为96.8% 。

基因组注释

基于Repbase和de novo repeat库,预测该基因组含有43.02%的重复序列,其中以DNA转座子类型的的重复序列最多,占16.73%(表2)。

通过de novo预测、同源比对预测并结合RNA-seq数据集,共预测基因23,923个(表3),其中注释到功能的基因有23,808个(99.5%)。

赤点石斑鱼的各项指标以及完整性均优于5月份发表的黑色石斑鱼参考基因组,可见采用Nanopore+Hi-C策略进行基因组组装优势明显。

表4 赤点石斑鱼与黑色石斑鱼基因组组装比较

本研究利用Nanopore测序技术的长读长优势结合Hi-C技术,组装出高质量赤点石斑鱼染色体水平的参考基因组,这一组装结果表明Nanopore测序产生的长读长序列可以有效地用于基因组组装,并显著提升基因组组装质量。对一个物种而言,完整的高质量的基因组序列是其广义研究中不可估量的宝贵资源,并且是基因组学、基因功能、分子和进化研究的坚实基础,基因组参考序列的质量在一定程度上也体现了该物种的研究进展和水平。

0 回复

发表评论

想参加讨论吗?
请尽情讨论吧!

发表评论

邮箱地址不会被公开。 必填项已用*标注