科学网多快好省的宏基因组研究技巧



近年的研究热点集中于环境和生物体相互作用的微生物群体,而大量复杂的微生物群体存在培养困难,构成复杂(包括细菌、古菌、真菌、原生生物、病毒甚至小型真核生物)。因此如何用高通量精准的了解这些群体的构成,基因功能分布以及具体的表达活性和代谢状况成为首要问题。



高通量测序技术的发展,让我们可以不经过培养,一次性了解微生物群落构成甚至基因代谢组成。



随着技术的进步,检测方法也逐渐丰富,对应的分析手段和软件算法也逐步完善,使我们可以根据研究需要选择不同的检测和分析策略来获得海量的数据并进行相应的研究分析。





01

简 介

免于培养的微生物学研究方法主要基于测序,高通量测序使我们一次可以获得整个微生物群体的数据信息,简单来说包括两种策略:



1、基于特定标记基因的扩增测序方案(常见的16s,ITs,18s或特定功能基因)



2、对整个群落DNA进行测序,获取全部微生物基因组进而进行分类和功能分析的策略(鸟枪法宏基因组测序shotgun metagenomics)。



基于16s基因的分析方法





由于其极低的成本,对于样本DNA的低要求非常适合于大规模群体样本的调查和分析,随着DADA2等分析方法的改进,物种分类精度和准确度也有所提升,加上PICRUST等功能预测方法一定程度上弥补了基因信息的缺失,因此16s这类基于基因的微生物研究方法仍然是不可或缺的方案。



下表列了16s常见的分析软件,目前QIIME2作为整合包使用最为方便,VSEARCH也作为UPARSE的开源版本使用也非常广泛。





16s测序的分析流程如下图,获得序列经过聚类后获得OTU或ASV,并得到相对丰度。



经过PICRUSt可以得到预测的基因分类丰度,进而进行alpha多样性和Beta多样性以及组间差异和相关性分析。





PICRSt的工作原理如下图,将OTU表内16s序列进行对应物种16s拷贝数标准化后,将物种丰度乘以已经整理好的物种的基因注释数表就获得基因的预测丰度。





02

浅宏基因组

浅宏基因组测序方案是去年knights-lab在msystems上发表的针对16s分辨率和宏基因组高成本之间的一个折中方案,通过降低测序深度,每个样本50万reads,但是物种的分辨率并没有低于一般宏基因组(普遍5~10G数据量)。



不通过拼接组装,直接基于kraken2等kmer,或MetaPhlAn2等标记基因的参考基因组方法进行种属丰度分类。结合其到菌株的物种分类和丰度数据可较16s方案下的PICRUST更加准确的预测基因构成。





Hillmann B, Al-Ghalith GA, Shields-Cutler RR, Zhu Q, Gohl DM, Beckman KB, Knight R, Knights D. 2018. Evaluating the information content of shallow shotgun metagenomics. mSystems 3:e00069-18. https://doi.org/10.1128/mSystems.00069-18.



我们发现有些小伙伴的需求是:



想要获得更全更精细分类精度同时不需要获得完整基因组序列和重建菌群基因的,而且目前我们浅宏基因组价格之比16s测序贵一点,大大低于升读宏基因组价格。



那么这时候,我们提供的浅宏基因组测序就可以成为很好的选择,其成本低(快要接近16s测序分析的价格了,文末有福利),分析简便快速,同样能获得宏基因组基本丰度数据。不过浅宏基因组也有其适用范围,根据样品类型的不同,一些样品可能包含 >99%的人类宿主DNA,这不仅增加了序列成本,而且给测量带来了不确定性。



在许多研究中也会采取在进行宏基因组测序文库的准备之前去除宿主DNA的方法。但是,在去除宿主DNA后,可能没有足够的微生物基因组DNA用于宏基因组测序,这通常需要最少50ng的输入。因此浅宏基因组较适合于宿主DNA含量较低的样本,如人类粪便、水体、土壤等;而如口腔唾液、肺泡灌洗液、血液等人体体液类样本就不太适合。



下图是宏基因组测序数据中比对到人类基因组的序列比例,根据样本类型不同而不同。





我们可以免费提供针对粪便及环境样本助力临床/科研取样。






上一篇:基因测序市场研究调研2021到2027年行业前景分析报
下一篇:基因组学深入挖掘·研究方案(上篇)