2 材料与方法
2.1 数据库的搜索
为了对水稻GRAS基因家族的功能进行分析,从植物TFDB数据库中分别下载了水稻、短柄草、拟南芥、高粱和玉米等各自的基因组序列。在RGAP数据库中下载了水稻GRAS基因的编码序列(Coding sequence,CDS),其中有关水稻基因芯片的数据是在水稻RiceXPRO在线数据库中收集的。
2.2 GRAS基因家族成员的鉴定
首先需建立一个隐马尔可夫模型谱(Profile HMM),再通过Hmmer软件,根据在拟南芥中已经鉴定出来的GRAS基因编码的蛋白序列建立出来。利用此模型检索从TFDB数据库中得到的水稻蛋白数据,得到的序列可认为是候选蛋白。再将这些候选蛋白通过Pfam程序,最后再利用SMART数据库鉴定出有无GRAS结构域,其中有GRAS结构域存在的蛋白序列即属于GRAS蛋白家族[22]。
2.3 GRAS保守结构域的鉴定和分析
采用MeMe在线程序对水稻GRAS基因家族的结构域进行分析[23]。程序中的基序重复的数量设置为“any”,基序的长度设置为“6~200”,基序的数量设置为“25”。
2.4 蛋白保守序列的比对和GRAS蛋白系统进化树的构建
首先,运用ClustalW程序对水稻GRAS转录因子基因做多序列联配比对[24]。再利用WebLogo程序对GRAS蛋白家族保守区域的氨基酸进行其保守性分析[25]。然后通过Mega5软件对结果进行分析,采用邻接法(Neighbor-Joining Method,NJ)生成GRAS基因家族的系统进化树,其中进化树校验参数Bootstrap设置为“1000次重复”。最后再用相同的方法对水稻、短柄草、拟南芥和高粱中的GRAS基因家族构建进化树进行综合比较分析。
2.5 GRAS基因家族所在染色体区段在不同物种中的复制分析
可以运用从植物基因组复制数据库PGDD获得的数据来进行水稻GRAS基因家族所在染色体区段的复制分析[24]。采用MapInspect软件构建水稻染色体上GRAS基因家族的复制情况。对于水稻与短柄草、高粱和玉米之间各自的GRAS基因所在区段上的染色体复制情况可以利用Ciros软件进行构建[26]。
水稻GRAS基因家族的生物信息学分析(3):http://www.youerw.com/shengwu/lunwen_64654.html