1. 材料与方法
1.1 数据来源
拟南芥CDPK基因及其蛋白序列来源于TAIR(http://www.arabidopsis.org/)数据库。以AtCDPK蛋白为检索序列,通过BlastP程序在EnsemblPlants(http://plants.ensembl.org/index.html)数据库中搜索相似蛋白。同时,利用Pfam工具(http://pfam.xfam.org/)检测这些蛋白中是否存在典型的CDPK结构域,存在该结构域的蛋白被视为CDPK家族成员。进而在数据库中下载茄科植物CDPK家族基因的基因组、编码区以及蛋白质序列,这些序列数据被用于基因结构、保守基序和功能结构域等研究。
1.2序列特征分析
利用Pfam工具鉴定这些蛋白功能结构域的位置及排列顺序,采用默认参数设置。通过比较CDPK基因的基因组和编码序列,可以鉴定出外显子和内含子组织结构,其基因结构图由GSDS 2.0服务器绘制。此外,利用MEME工具可以检测茄科植物CDPK蛋白中存在的保守基序,并绘制这些蛋白保守基序组织模式图,参数设置如下:最长和最短基序分别为195和14个氨基酸,基序最大与最小位点数目为195和14个位点,其它参数为缺省值。
1.3 序列联配与系统进化分析
为弄清楚茄科植物CDPK基因的进化关系,笔者将拟南芥、番茄与土豆的CDPK蛋白进行多序列联配,该过程由T-coffee(http://www.phylogeny.fr/)完成。将比对结果提交到BioNJ(http://www.phylogeny.fr/)在线工具上进行系统进化树构建工作,参数设置为默认值。树文件以Newick格式导出,将这个树文件提交到TreeDyn(http://www.phylogeny.fr/)在线服务器上产生进化树图片,然后直接导出。
1.4 同源基因对的选择压力检测
为鉴定CDPK家族的同源基因对,利用PGDD(http://chibba.agtec.uga.edu/)数据库查询到具有共线性且序列相似度大于60%的同源基因对。然后,将这些同源基因对的蛋白序列比对文件与编码序列文件提交到Pal2nal在线工具,直接计算出每一对同源基因的Ka和Ks值,进而计算出ω值。最后,直接在Excel工具中绘制Ka、Ks、ω值的分布图。
1.5 同源基因对的表达谱分析
由于同源基因对的选择压力均为负选择,因此同源基因对之间的比较保守。为进一步看看这些同源基因对之间的表达情况是否发生分歧,我们针对番茄同源基因对SlyCDPK1/SlyCDPK8、SlyCDPK4/SlyCDPK6和SlyCDPK3/SlyCDPK5的表达情况进行了分析,这些基因的表达数据来源于NCBI的GEO数据库。对这些表达数据进行处理,利用RPKM数值代表这些基因的相对表达量。
2. 结果与分析
2.1 茄科植物CDPK家族基因的鉴定与系统进化关系
茄科植物CDPK的基因序列具有两个保守功能结构域,一个是激酶结构域,另一个是钙调素类结构域。由表1可看出,拟南芥含有34个基因,番茄含有27个基因,土豆含有24个基因,土豆和番茄的CDPK基因大致都分布在1~12号染色体上,基因长度大约为3000~30000bp,不同的CDPK基因具有不同的起始和终止位点,分布于不同的染色体和正负链上,例如,StCDPK4和StCDPK5,它们分别位于11号和2号染色体上,一个在正链上,一个在负链上,一个是4296bp,一个是4931bp,但也有位于相同的染色体上,如StCDPK1,StCDPK2和SlyCDPK23、SlyCDPK24等,都位于11号染色体上。
由上进化图谱可以看出,根据拟南芥、番茄和土豆这三个物种的CDPK蛋白家族的的亲缘关系的远近,将这三个物种的CDPK蛋白分成了I、II、III和IV类群,每组中都包含了拟南芥、番茄和土豆的CDPK基因,这表明,这个基因家族的进化特征形成于拟南芥、番茄和土豆分离之前,但是CDPK基因的进化关系在这四组中表现的各不相同(图1),如Igroup中的AtCDPK16和AtCDPK18以及SlyCDPK8和SlyCDPK1表现为旁系同源关系,在IIgroup中的,SlyCDPK18和AtCDPK26以及AtCDPK4和SlyCDPK24表现为直系同源关系,这也就充分的说明了这几个CDPK蛋白基因在番茄和拟南芥中表达出相似的蛋白,并且具有相似的功能。然而,SlyCDPK20和SlyCDPK26又是StCDPK6的共同的直系同源关系,这可能是番茄和土豆这两个物种在同一时间内发生了一次物种的复制,从而导致了这种基因对的现象。 茄科植物CDPK家族蛋白的分子特征与进化分析(2):http://www.751com.cn/shengwu/lunwen_30277.html