玉米(Zea mays)是一年生禾本科植物,起源于美洲大陆,大约在16世纪初期传入我国,玉米的传入为急剧增长的人口提供了必需的粮食[6]。玉米在全世界热带和温带广泛种植,是重要的粮食作物和饲料作物,在解决温饱问题和发展国民经济中发挥了重要作用[7]。然而,重要作物如玉米中的BRD基因及其功能还不明确。本研究采用生物信息学方法对玉米基因组中的BRD基因进行系统鉴定,并对其进化机制和表达模式进行全面分析,为该家族基因的进一步功能研究奠定基础。
2 材料与方法
2.1 序列检索、蛋白质等电点以及亚细胞定位分析
利用BRD结构域的一致性序列在玉米基因组数据库(MaizeGDB,/)中进行检索,以鉴定玉米BRD基因。对E值<10-5的序列在Pfam数据库中(http://pfam.xfam.org/search)验证是否存在BRD结构域。若其为要找的BRD基因,则下载其编码序列(CDS)和蛋白质氨基酸序列,并记录染色体位置、外显子数、转录方向,以及蛋白质氨基酸数等基本信息。
使用ProtParam工具(h/)进行蛋白质等电点和分子量预测。利用TargetP 1.1 Server(http://www.cbs.dtu.dk/services/TargetP/)进行亚细胞定位分析。
2.2 染色体分布和复制事件
在MaizeGDB网站上下载基因的座位信息,利用MapChart软件绘制染色体分布图。若两个基因在染色体上相距很近,以间隔不超过5个基因确定串联重复事件。
2.3 多序列对比和系统发育分析
采集到玉米BRD蛋白的氨基酸序列后,使用MEGA5.1软件进行多序列比对,采用邻接法(Neighbour-Joining method)构建系统发育树,bootstrap重抽样进行了1000次。
2.4 表达分析
利用已知的玉米BRD基因的CDS序列在NCBI EST数据库(/)中进行搜索,选择匹配率大于95%、长度大于200bp且E≤10-10的作为对应的EST序列记录下来,对序列联配的结果按组织器官的来源进行分类,从而获得玉米BRD基因的表达信息。玉米BRD基因的RNAseq表达分析以对应的基因座位号在RNAseq数据库(ITE=maize_sRNA)中进行检索,获得RNAseq表达信息。文献综述
3 结果与分析
3.1 玉米BRD基因
利用BRD结构域一致性序列在MaizeGDB 中进行比对搜索,并在pfam数据库中进行鉴别,一共鉴定出了16个玉米BRD基因。根据BRD基因在染色体上的位置,将其系统命名为ZmBRD1~ZmBRD16。基因的基本信息列于表1。玉米BRD基因的外显子数从3个~11个不等,结果说明它们均不起源于逆转录转座事件。玉米BRD蛋白质的长度变异较大,最短的为ZmBRD16,含有447个氨基酸,最长的为ZmBRD4,有1309个氨基酸。蛋白质等电点分析结果表明,有8个玉米BRD蛋白为酸性蛋白,其他8个玉米BRD蛋白为碱性蛋白。亚细胞定位预测分析表明,有7个玉米BRD蛋白定位为叶绿体,其余BRD蛋白定位在其他位点。
3.2 染色体分布和复制事件
为研究BRD基因在玉米染色体上的分布,通过基因组检索确定了16个ZmBRD基因在染色体上的位置,利用MapChart软件绘制分布图(图1)。结果表明,ZmBRD基因分布在9条染色体上,其中2号染色体上最多,有4个基因,4号染色体含有3个基因,5号和7号染色体分别含有两个基因,其余染色体均含有1个基因(图1)。基因复制分析表明没有基因起源于串联重复事件。
3.3 玉米BRD蛋白系统发育分析来.自/751论|文-网www.751com.cn/
为了研究玉米BRD家族的进化历史与机制,对16个BRD蛋白进行系统发育分析(图2)。从系统发育树上可以看到,16个BRD蛋白一共可以分为2个不同的亚族(Ⅰ和Ⅱ),说明其序列和功能已经发生分化。在系统发育树的末端发现了7对旁系同源基因,说明该家族以物种特异的方式进行了扩张。