系统进化树介绍、构建方法及绘制详解【技术贴



系统发育分析中,最重要和最常见的内容为构建系统发育树。系统发育树也称为系统发生树(phylogenetic tree)、聚类树或者进化树(evolutionary tree)。以树状结构表示各个节点的进化关系,枝点可以是物种、同一物种的样本、基因等单元。

系统进化树介绍、构建方法及绘制详解【技术贴

系统进化树中各个元素的介绍如图1所示

系统进化树介绍、构建方法及绘制详解【技术贴

图1 进化树的结构示意图

根据是否指定了根节点,系统进化树可以分为有根树和无根树。
有根树指定了根节点,树中可以看出各个节点的距离和祖先节点以后各个分枝分化的先后关系,因此可以用于分化时间的推断;
无根树没有指定祖先节点,只能看出各个节点的拓扑结构和相对距离。
无根树和有根树图示如图2。图2左边的进化树只看到了材料的聚类关系和相对距离的远近,无法判断哪个分枝属于较为古老的分枝,哪个分枝为比较年轻的分枝;而图2右边的进化树加了外群,并且把外群指定为根,所以从图中除了可以看到材料的相对距离以外,还可以可以看到各个分枝材料的分化顺序。有根树根的选择应有所讲究,一般选择所研究的材料(根以下的全部材料)的最近的共同近缘种作为外群。

系统进化树介绍、构建方法及绘制详解【技术贴

图2 无根树和有根树[1,2]

随着测序成本的下降,简化测序和全基因组重测序在遗传进化中的应用变得越来越广泛,对研究群体进行简化测序或者全基因组重测序获得的用于分析的标记通常为SNP标记,有许多研究人员获得SNP标记后,往往不知道如何利用SNP标记进行进化树的构建,脑子往往一直停留在序列比对–修改–构建进化树的阶段,其实基于SNP进行进化树的构建的过程相当简单,每个样本的每个位点连起来就是一条序列,因为每个样本的SNP数目相同,所以比对这一步就可以直接省去了。

下面小编就从VCF开始,告诉大家如何用比较流行的MEGA软件进行系统进化树构建,我们只需要准备两个软件:TASSEL(https://bitbucket.org/tasseladmin/tassel-5-standalone/downloads/?tab=tags)和MEGA7()即可完成进化树构建的全部操作。

VCF转MEGA格式。用TASSEL打开VCF文件,另存为Phylip格式(Save As —  Phylip(Interleaved)),如图3,然后用MEGA7把Phylip文件转换成MEGA格式(File — Convert File Format to MEGA — 选择刚才转出的Phylip文件按提示操作存成.meg文件),转出的格式如图4,前两行为文件头信息,无实际意义,但是必有。“#33-16”表示样本编号,与fasta文件的格式不同,mega格式样本的起始不是“>”而是“#”,接下来便是该样本的SNP连接成的序列信息。

系统进化树介绍、构建方法及绘制详解【技术贴

图3 使用TASSEL把VCF转为Phylip(Interleaved)格式

系统进化树介绍、构建方法及绘制详解【技术贴

图4 MEGA文件格式

系统进化树构建步骤:

1、mega文件导入:
File — Open A File/Session — 选择要导入的文件,选择数据类型(如果是SNP即为Nuceotide Sequences),提示Protein-coding nucleotide sequence data时,选择No,即不把DNA序列翻译成蛋白序列构建进化树,如图5。

系统进化树介绍、构建方法及绘制详解【技术贴

图5 meg文件导入

2、系统进化树的构建
选Phylogeny选项卡,在可选的方法中选择一种方法进行系统进化树的构建,种内材料一般选择NJ法即可,属内种间或属以上材料可以用ML(maximum likelihood tree)法(ML法计算之前,可进行最优模型的选择:Models — Find Best DNA/Protein Models,使用选出的最优模型进行ML树的构建),下面以NJ法为例进行说明。
参数设置,主要填写Bootstrap值,一般选择500或1000次;Model一般用Kimura 2-parameter Model(K2),如果K2模型运行不了,可以换成p-distance模型;Gaps/Missing Data Treatment选择Partial deletion或者pairwise deletion,选择complete deletion时带有缺失值的标记都会被删除,所以必须谨慎;Site Coverage Cutoff与我们常说的完整度相同,一般填写成我们过滤标记时使用的完整度,上述参数设置完成后,点击compute即可。(见图6)




上一篇:中国人口普查(2020年我国第七次人口普查结果是多
下一篇:达安基因董事会换届起争端:候选人名单遭国资