GT元件最初是在豌豆叶片rbcS-3A基因启动子中鉴定出来的[8],是一类能够与Trihelix保守结构域特异性结合的的光应答元件(称作BoxⅡ),所以以往的研究只局限于它们对光依赖性靶基因的调控[12],例如对光敏色素PHyA的调控[18]。但随着生物技术的不断发展,许多重要基因的功能得到鉴定,为作物优良栽培和培植提供了丰富的理论基础,其实践的成功使得对功能基因的研究更具重要性。据研究发现[25],Trihelix家族基因的功能十分广泛,在通过激活或抑制光依赖型靶基因的转录参与光应答、抗逆境和生长发育方面具有重要作用。另外,Trihelix家族基因还有可能在染色体结构维持[19]、脂肪酸合成[4]等也扮演了重要角色。所以对Trihelix家族基因的进一步深化研究,不仅可拓宽对该家族基因的认识,而且对深入理解植物逆境胁迫应答机制和众多生长发育调控机制具有重要理论意义。
本文利用公布的水稻等基因组草图数据,对全基因组Trihelix转录因子基因家族筛选,分析Trihelix转录因子的数目并进行分类,同时进行系统发生学进行分析并进行比较。该研究全面了解Trihelix基因家族的信息和特点,对植物Trihelix基因的克隆、功能鉴定具有重要意义。
2 材料与方法
2.1 植物Trihelix超家族转录因子的鉴定
为了对植物Trihelix超家族转录因子进行功能分析,我们从植物TFDB数据库中下载了相关物种的Trihelix转录因子超家族序列(http://planttfdb.cbi.edu.cn/) [26]。这些Trihelix家族序列分别来自拟南芥基因组序列(Arabidopsis)(http://brassicadb.org/ brad/index.php);水稻(Oryza sativa)基因组序列 (http://rice.plantbiology.msu.edu/, release 5.0);短柄草(Brochypodium distachyon)基因组序列 (http://www.brachypodium.org/);源'自:751:"论-文'网www.751com.cn高粱(Sorghum bicolor)基因组序列 (http://www.plantgdb.org/SbGDB/)。在得到相关物种的Trihelix基因家族序列之后,我们的首要工作便是对于这些Trihelix超家族基因进行结构域鉴定。首先,这些蛋白的结构域都通过Pfam程序(http://pfam.sanger. ac.uk/) [27,28]进行分析,若存在Trihelix结构域,则认为该候选蛋白属于Trihelix蛋白家族,若未能检测出Trihelix结构域,则认为其不属于该家族。随后,作为最终的序列质量刷选标准,我们将这些Trihelix超家族转录因子的保守结构域采用SMART 数据库进行进一步的分析(http://smart.embl-heidelberg.de/) [29]。此外,针对水稻Trihelix基因家族,我们从水稻RGAP中下载每一条记录的基因序列、蛋白质序列、CDS序列,获得每一条记录的外显子数、蛋白质氨基酸数,并且从KOME(http://cdna01.dna.affrc.go.jp/cDNA/)网站中获取其mRNA获取号,从ExPASy数据库(http://www.expasy.org/)中获取其蛋白质等电点。
2.2 蛋白序列的比对和水稻Trihelix蛋白系统发生的进化树构建
水稻Trihelix全长蛋白的多序列比对通过ClustalW程序进行分析[35]。Trihelix蛋白家族特定保守区域氨基酸的保守性我们通过WebLogo程序进行分析[30];系统发生树的构建和分析主要通过Mega5软件进行(http://www.megasoftware.net/)[31]。我们主要对Trihelix蛋白的保守区域采用邻接法(Neighbor-Joining Method,NJ)来进行进化树的构建,设置Bootstrap为1000次重复。