从植物TFDB基因组数据库下载相关物种的SBP转录因子全基因组序列(http://planttfdb。cbi。edu。cn/) [16],包括水稻SBP基因组序列、短柄草SBP基因组序列、大豆SBP基因组序列和玉米SBP基因组序列。
2。1。2 SBP家族转录因子的鉴定
通过数据库得到相关物种的SBP基因家族序列之后,就是对这些SBP家族基因结构域进行鉴定。首先要对植物全部基因进行筛选,然后把选中的SBP基因利用Pfam (http://pfam。sanger。 ac。uk/)[17]进一步筛选具有SBP保守结构域的蛋白质的序列,最终得到的序列采用SMART数据库进行进一步的分析(http://smart。embl-heidelberg。de/)[18],得到这些序列的基本信息。水稻的19个SBP转录因子的获取后,通过数据库搜索蛋白质分子量和等电点等属性[19]。
2。2 水稻SBP转录因子家族基因的在线分析
对于SBP转录因子家族基因的分析利用蛋白质保守基序在线搜索程序MEME(http://meme。nbcr。net/meme/cgi-bin/meme。cgi)来分析水稻SBP转录因子家族的保守基序[20]。在线程序进行过程中我们采用CustalX软件按要求设置参数[21]:(1) 基序重复数量:any;(2) 基序长度:10-50;(3) 预测基序数量:10。
2。3 水稻SBP蛋白系统发生的进化树构建
通过ClustalX程序进行水稻SBP转录因子家族全长蛋白的多序列分析后,再运用WebLogo程序对水稻SBP蛋白家族特定保守区域氨基酸的保守性进行分析[22]。而系统进化树的构建和分析利用Mega5(http://www。megasoftware。net/)[23]软件进行。系统发生树的分析时,运用邻接法(Neighbor-Joining Method,NJ)[24]对SBP蛋白的保守区域来建构其进化树,在ClustalX软件的Bootstrap中执行,设置Bootstrap为100重复统计。
2。4 水稻SBP基因家族不同组织的表达分析
综合利用水稻基因芯片中的数据(http://ricexpro。dna。affrc。go。jp/data-set。html)[25]来分析水稻SBP转录因子在不同组织中表达情况。选取的组织部位包括了叶片和叶鞘、根、茎、穗、花药、雌蕊、花序、子房、胚珠、胚和胚乳等。运用Cluster程序(http://bonsai。hgc。jp/~mdehoon/ software/cluster/software。htm) 对SBP转录因子在不同组织中的表达情况进行层次聚类分析,得到的数据结果后再利用TreeView(http://jtreeview。sourceforge。 net/)软件进行可视化显示[26]。
3 结果与分析文献综述
3。1 水稻 SBP家族转录因子的鉴定与分析
对于植物SBP家族转录因子鉴定,要先从NCBI数据库中选取SBP结构域的氨基酸序列, 然后再利用Blastp程序,将P-value值设为10- 4后再搜索水稻全基因组蛋白质数据库,找到全部候选的含SBP的蛋白的水稻基因组。最后利用蛋白家族数据库Pfam(http:/ /pfam。 wust。l edu /hmm search。 shtml)对全部蛋白进行筛选。采用SMART数据库对这些保守结构域进行进一步的分析。最后,为了去除候选基因中的重复序列,通过ClustalX的方法对已被选取基因的核苷酸序列进行多序列排列比对。最后,我们收集所有具有SBP保守结构域的基因(表1)。对19个水稻SBP基因结构域的氨基酸序列进行ClustalX多序列比对(图1)。其中最长的序列有1141个氨基酸残基,最短的序列有217个氨基酸残基,等电点范围为5。2792~10。8356。WebLoge中显示大概有8个左右的保守的Cys或His残基(CX4CX13HX5CQQCX3HX11C)。