1964年,Linus Pauling[6]提出分子进化理论;根据物种分子特性,了解物种之间的生物进化关系。同一家族的大分子发生在分子层面的进化过程:核酸和蛋白质分子。通过研究生物大分子的核苷酸和氨基酸序列,通过系统发育分析,进而了解生物的进化历史。分子进化的研究可以为生物进化过程提供佐证,为深入研究进化机制提供重要依据。[6]
分子进化研究的目的是从物种的一些分子特性出发,构建系统发育树,进而了解物种之间的生物系统发生的关系;二是核酸序列和蛋白质结构功能分析,共同祖先的生物大分子具有相似结构和生化功能,则通过序列同源性分析来构建系统发育树,从而可以通过已知数据进行分析和功能预测;三是通过研究序列,从而可以进行进化速率分析。
1.5.2系统发育
系统发育学研究各物种的同源特性,通过系统发育分析预测各物种间的进化关系。系统发育分析所推断出来的进化关系一般用进化树来描述,这个进化树描述了基因树,物种以及二者之间遗传关系的谱系。[5]
在现代系统发育研究中,不仅仅是对生物的形态学特征或其他特征的研究,而是通过对生物大分子如核酸序列和蛋白质序列的系统发育分析。分子系统发育学研究的发展源于对大量序列的测定和程序分析。分子系统学与其他实验性学科进行对比同样有其局限性。系统发育的发生过程都是己经完成的历史,我们只能通过数据分析推断过去生物进化关系,却不能重现生物进化的历史。没有实验基础或者是通过模拟实验或者病毒实验进行的系统发育分析。那我们该如何处理序列从中得到有用信息,用什么样的计算办法得到可信的系统发育树,从已知的数据中得到生物进化的模式,这些研究成为这个领域的热点。
1.6进化树的构建
首先,选择“特征分子”。原则是:a.各个物种都有的同源分子,b.进化速率适当;然后,对这些同源分子的序列进行多序列比对(multi-sequences alignment),截取比对的最好区域作为物种的代表序列;接着,按某种方法,算出代表序列两两之间的差异度。最后,基于这些差异度,绘制系统发育树。
表1介绍分子进化树的种类
种类 软件
邻接树(NJ) Mega
最大似然树(ML) PHYML PAML,Tree-puzzle
最大简约树(MP) PHYLIP ,MEGA,PAUP
最小进化树(ME) PHYLIP
1.6.1选择特征分子
大多数情况下,在功能研究中选择蛋白质序而不是核酸序列其主要原因是蛋白质序列含有更多相对保守的序列结构域,则匹配越高位点的保守性越好。
1.6.2序列比对
基于上面的操作,只有正确的比对结果才会推出较好的系统发育。多序列比对对于检测序列之间的关系和共同特征更敏感,它有助于预测新序列的二级、三级结构,是系统发育分析的重要步骤。然而,错误的比对结果会导致最后发育树在分类上的错误,甚至是整个发育树的错误。多序列比对的结果应该进行检验并找出一个最合理的结果。对这些同源分子的序列进行多序列比对,序列编辑软件截取比对的最好的区域作为物种的代表序列。下表2,多序列比对常用软件分析。