油质蛋白最早是从芥菜中发现的,但这种蛋白的分离物最初来源于花生(Arachis hypogaea)种子。随着首个OLE基因被克隆以来,OLE基因已在很多作物中被克隆出来,主要物种包括油菜(Brassica campestris)、玉米(Zea mays)、大豆(Glycine max)、拟南芥、向日葵(Helianthus annuus)、棉花(Gossypium hirsutum)、芝麻(Sesamum indicum)、水稻(Oryza Sativa)、小麦(Triticum aestivum)和木本油料植物油茶(Camellia oleifera)等[2-7]。利用细胞免疫学和亚细胞定位方法,对OLE蛋白在细胞位置进行分析,结果显示只存在于种子油体中绝大多数油质蛋白位于油体上,少量位于油体附近的内质网片段上。序列特征分析表明,不同植物来源的OLE蛋白具有相同的结构特性,都具有3个基本的结构域:1)N端40-60个氨基酸组成的两亲性区域,这一区域分布于油体朝向胞浆的一面;2)中间68-74个氨基酸组成的高度疏水区域,推测其为伸入三酰甘油基质中,其顶部具有由3个脯氨酸和1个丝氨酸组成的“脯氨酸结”;3)C端的33-40个氨基酸组成α-螺旋结构域,该结构域兼具亲水和亲脂性,带负电荷的部分朝向油体表面。就功能结构域而言,所有植物OLE蛋白均具有典型OLE结构域(PF01277)。随着基因组测序物种越来越多,油体相关基因家族在全基因组水平上研究工作已经被开展[8-10]。目前,OLE蛋白家族研究已经在拟南芥、水稻、花生、桐树以及部分豆科植物中开展,这些研究对深入甚至OLE家族基因的序列特征、进化关系以及功能具有重要作用[11-13]。但是,这类研究主要集中在模式植物,而木本植物OLE家族基因的结构特征与功能仍然未知。
麻疯树是一种重要的木本植物,同时其种子油也是制备生物柴油的理想原料。麻疯树(Jatropha curcas)又名小桐子、膏桐和木花生等,属于大戟科麻疯树属落叶灌木或小乔木,在我国主要分布于云南、四川和贵州等热带和亚热带地区。深入研究麻疯树OLE基因的功能,很可能开发产能高效的麻疯树品种,为缓解能源危机提供帮助。本研究以麻疯树OLE家族基因为研究对象,利用生物信息学手段,在全基因水平上鉴定OLE基因家族的成员数目,并详细剖析这些基因的结构、蛋白保守基序、保守氨基酸位点和系统进化关系。这些研究为深入剖析麻疯树OLE家族基因的功能提供了有益线索。
1 材料与方法
1.1 数据来源与序列检索
拟南芥OLE基因相关序列直接从TAIR数据库(https://www.arabidopsis.org/)中下载,其基本信息见附表1。接下来,以这些序列作为检索序列,利用BLAST在线工具在麻疯树数据库中搜索每一个AtOLE基因对应的同源基因,这些同源基因组成OLE候选基因。为确定麻疯树OLE基因数目,利用Pfam工具[14]鉴定这些OLE候选基因的蛋白功能结构域,只有含有OLE结构域(PF01277)被认为是麻疯树OLE蛋白。最后,收集并下载这些麻疯树OLE基因基本信息与序列(表1)。
1.2 序列比对与系统进化分析
为阐明麻疯树OLE蛋白的系统进化关系,笔者以麻疯树与其它25种常见植物OLE蛋白为研究对象,利用Muscle(http://www.phylogeny.fr/)工具对这些序列进行比对,再利用MEGA软件[15]中的邻接方法构建OLE蛋白的进化树,进化树图片直接利用MEGA软件导出。
1.3 基因结构与蛋白特性分析
麻疯树OLE基因的基因组和编码序列被提交到GSDS工具上,两者比较分析可得到相应的基因结构。麻疯树OLE基因结构图,可以直接由GSDS软件导出(http://gsds.cbi.pku.edu.cn/)[16]。麻疯树OLE蛋白序列被提交到MEME服务器进行保守基序分析(http://meme.nbcr.net/meme/)[17],参数设置为:保守基序长度范围为10-160个氨基酸,保守基序位点数目范围为10-160个氨基酸,保守基序最大数目为10个。 麻疯树油质蛋白家族基因的鉴定序列与进化分析(2):http://www.751com.cn/shengwu/lunwen_27905.html