直链淀粉和支链淀粉都是通过一系列的淀粉合成酶催化合成的。这些酶活性是淀粉合成和支链淀粉结构合成所必需的,直链淀粉主要是在颗粒结合淀粉合成酶(Granule-bound Starch Synthase,GBSS)催化下合成的[7,8],而支链淀粉是 4 种淀粉合成酶共同作用的结果,它们分别是二磷酸腺苷葡萄糖焦磷酸化酶(ADP-glucose Pyrophosphorylase,AGPP)、可溶性淀粉合成酶(Soluble Starch Synthase,SSS)、淀粉分支酶(Starch Branching Enzyme,SBE)和脱分枝酶(Starch Debranching Enzyme,DBE),这五种酶是淀粉合成途径中的五种关键酶[9,10]。
为探明淀粉在禾谷类植物中的生理生化功能,鉴定与比对禾谷类植物淀粉合成途径关键酶及其调控基因是基础性工作[11]。目前,淀粉的合成途径在水稻、小麦、高粱、玉米和拟南芥等物种[12]中已有较多的报道,前人对参与淀粉合成的五种关键酶的功能进行总体概述,并且对上述物种进行了测序。其中,拟南芥物是遗传学与分子生物学研究的模式植物,具有较高的经济价值[13]。随着拟南芥全亚群测序逐步完成,我们利用生物信息学方法挖掘与分析重要基因或基因家族已经成为一种方便快捷的常用方式。尽管拟南芥物淀粉合成关键酶基因已有较多的研究报道,但迄今为止,禾谷类植物淀粉合成关键酶基因的相关研究较少。本研究利用已报道的拟南芥淀粉关键酶蛋白序列,采用 BLAST 程序[14]检索其相似序列,根据生物信息学的方法,对禾谷类植物淀粉关键酶基因进行多序列联配和系统发生树构建,分析淀粉酶基因所编码蛋白质的保守序列,同源基因对的表达和适应性进化。
1 数据与方法
1.1 物种选择与基因检索
拟南芥淀粉关键酶基因已经被鉴定,主要包括AtAPL1~AtAPS1、AtSSI~AtSSIV、AtGBSS、AtBE1~AtBE3和AtISA1~AtISA3,共17个基因。接下来,以拟南芥17个淀粉合成关键酶基因作为检索序列,利用BLAST搜索工具从Phytozome数据库中检索禾本科植物中存在直系同源基因。具体参数设置为:序列相似性大于30%,序列覆盖率大于80%,E值小于1e-5,其它参数默认。最后,将搜索到的禾本科植物淀粉合成酶候选基因进行翻译,得到相应的蛋白序列,将这些蛋白序列进一步提交到Pfam在线工具中鉴定其功能结构域。保留含有功能结构域的禾本科植物淀粉合成关键酶直系同源基因用于下一步分析。
1.2 序列比对与聚类分析
利用Clustal X[15]软件对搜集到的淀粉关键酶蛋白序列进行多序列联配分析,参数设置为默认数值。为了揭示禾谷类植物淀粉合成关键酶基因的进化关系,以序列联配的结果为基础,用MEGA[16]程序构建拟南芥和禾本科植物淀粉关键酶蛋白序列的进化树。进化树由邻接方法(Neighbor-Joining method)产生,校验参数Booststrap 1000次重复,对构建的系统发生树进行评估,其数值未显示。
1.3 蛋白序列特征分析
为鉴定禾本科植物淀粉关键酶蛋白的保守基序组成情况,本研究基于生物信息学手段,利用MEME Suite 4.10.0(http://meme.nbcr.net/meme/)在线服务器对禾本科植物淀粉关键酶蛋白中存在的保守基序进行详细剖析。具体参数设置为:保守基序最小长度为12个氨基酸,保守基序最大长度为100个氨基酸;保守基序分布特征为每个序列至少有0或1个保守基序;保守基序最大数目为12个,最小数目为0个;保守基序最大位点数目为100个位点,最小位点数目为6个;其它参数均采用默认条件。
1.4 同源基因对的选择压力检测
利用PGDD(http://pfam.xfam.org/)数据库中Locus Search工具挖掘出具有共线性的直系或旁系同源基因对。为阐明这些同源基因对之间的选择压力,利用滑动窗口方法,对每一对同源基因对的选择压力进行检测,参数设置如下:滑动窗口大小100 bp,步移长度10 bp,其它参数默认,该过程由JCoDA软件完成[17]。 禾谷类植物淀粉合成关键酶的鉴定与比较分析(2):http://www.751com.cn/shengwu/lunwen_34499.html