PacBio三代宏基因组测序大幅提升海洋水体宏基因组研究效果
期刊名:Frontiers in Microbiology
影响因子:5.64
布景介绍
三代测序的读长长,但错误率较高,且宏基因组的组拆软件大都是基于二代测序设想,所以在既往的宏基因组学研究中较少用到三代测序数据,然而二代测序在宏组学研究中仍存在一些手艺局限,如在类似性较高的微生物组和原核基因组中,短reads的组拆效果欠安。本文以冬季地中海混合水样为研究对象,深切比力二代测序与三代测序数据对宏基因组组拆正文的效果。
尝试设想
将PacBio Sequel II的长读长(LRs)与典范办法—利用Illumina Nextseq短读长(SRs)序列停止宏基因组研究及组拆的比力。
次要结论
长读长测序手艺性价比更高
在同等成本下,PacBio测序产生的原始数据可达Illumina测序数据的18倍。
更高的分类分辩率和可靠性
LRs基因片段能够进步16S rRNA的分类,削减未实现分类的reads数量(0.4% LR和1.3% SR),LRs用于宏基因组学组拆能够制止组拆过程中的错误,因而具有更高的分类分辩率和可靠性。
得到更优良的组拆序列
成果显示,由CCS组拆得到的序列优于IDBA SR(SRa),metaSPAdes CCS5获得的更大contig长度可达2.6 Mb,比SRa组拆成果高一个数量级;metaSPAdes CCS5的均匀contig大小也比SRa高7倍;利用metaSPAdes和CCS15池实现了更好的拆配成果。
组拆无偏好
通过比力LRs组拆与SRa组拆在门程度的分类差别来验证metaSPAdes CCS15的组拆能否具有偏向性,发现那两种办法均能够有效收受接管所有菌门,仅存在数值上的差别,该成果证明了metaSPAdes CCS15在组拆微生物基因组过程中没有产生过大偏好。
补齐典范MAGs的短板
关于外界情况中一些最遍及存在的菌,典范MAG的产出率很低,如远洋细菌(Pelagibacterales)在上层海洋水域占主导地位,但在通过宏基因组研究检索到的MAGs数量相对较少,目前公共存数据库中只要34个MAGs(中等量量,50%完好,5%污染),另一个例子是Ca. Actinomarinales ,它是普遍散布在海洋中的一种放射线细菌,公共存数据库只要7个MAGs。那种异常现象的原因尚不清晰,可能是那些微生物具有高度的序列微多样性特征。LR宏基因组组拆大大进步了那两类微生物的组拆效果。LRa的数据量是SRa的6倍,而且有更长的contigs,那有助于恢复完好的MAGs。
更强的基因挑选才能
为了进一步评估LR宏基因组组拆正文新卵白的才能,本研究选择了三个常用于评估宏基因组判定才能的卵白:视紫量、聚酮合成酶(PKS)和CRISPR系统。
①在LR中判定到的视紫红量的数量最多,能够识别三个Tara拆配中没有的、新的视紫红量,那表白即便是单一的样本,LR宏基因组也能够组拆出新的视紫红量;
②聚酮合成酶分为三类,三个数据集挑选到类型1的数量类似,关于类型3和杂囊性糖脂合成酶PKS,LRa的挑选判定才能最强;
③在LR中,发现4个既包罗Cas卵白又包罗完好CRISPR阵列的序列。
获得高量量、可靠的MAGs
以培育组做为参考,比力两种办法产生的MAGs的完好脾气况,在LRa和SRa中检索到两种微生物基因组。SRa只要2%完好度,有6个小contigs,此中最长的为34 kb;LRa MAG几乎笼盖了整个纯培育获得的基因组,只要6个contigs,最长608 kb,占纯培育株系基因组的98%以上。
总之:LRa比之前的Illumina表示得更好,产生更大的contigs,更容易binning,因而,能够组拆复原更多更完好的宏基因组数据来源的基因组,包罗许多适应性基因。它可能会弥补SAGs和MAGs,以获得在过去十年中发现的许多新群体的完好和可靠的基因组,进步它们的正文效果。
文章链接:
Enhanced Recovery of Microbial Genes and Genomes From a Marine Water Column Using Long-Read Metagenomics.Frontiers in Microbiology.2021
DOI:10.3389/fmicb.2021.708782.