依照水稻Trihelix基因序列的获取过程,按基因号可在TFDB数据库中查询得到二穗短柄草、高粱中的Trihelix基因序列[39],随后对数据整合,从RGAP数据库(http://rice。plantbiology。msu。edu/)中获取目标转录因子的CDS序列,每个基因号对应不同的CDS序列。在KOME数据库中获得各自相对应的Trihelix基因序列号,并进行数据整合,以便后期分析处理。借助水稻RICEXPRO在线数据库可以得到水稻Trihelix家族基因在水稻不同组织不同时期基因表达和六种不同激素处理后基因表达的芯片数据[40]。
2。2 Trihelix保守序列的鉴定和分析
Trihelix转录因子家族含有一段特殊的保守结构域,利用在线搜索程序MEME (http://meme。nbcr。net/meme/cgi-bin/meme。cgi)分析蛋白质保守基序,并将参数设置成“any”,设定这些基序的长度为6~200,预期存在20个基序[41]。
2。3 多序列联配、蛋白质保守序列对比和系统进化树的构建
首先,我们对Trihelix家族特殊保守结构域的氨基酸进行了多序列联配分析,应用Cluster软件分析所得结果,随后借助Mega程序(http://www。megasoftware。net/)对水稻Trihelix保守结构域作进一步的分析,将Bootstrap的值设定成1000[42]。将Mega程序分析的结果借助WebLogo 软件进行直观性的图示化,即可验证转录因子保守域的分析结果。依照水稻Trihelix特殊结构域分析的方法和步骤,采用邻接法构建出水稻、拟南芥、二穗短柄草和高粱中该家族的系统进化树[43],对比单独分析水稻中Trihelix家族系统进化树,我们发现,在不同物种间,Trihelix家族同样可以得到五个亚家族分类,图中不同物种用不同颜色不同形状标记。
2。4 Trihelix基因家族在不同物种中染色体区段的复制分析
借助于PGDD (http://chibba。agtec。uga。edu/duplication/)分析所选的Trihelix基因各自所在染色体区段的线性复制情况[44],将所有存在染色体复制关系的数据进行整理,借助基因染色体定位软件MapInspect完成图示化结果展示;按照上述方法将水稻与二穗短柄草、水稻与高粱之间的Trihelix基因进行线性复制关系分析,为了更好地展示,这次将得到的结果借助Circos软件进行图示化[45],便可直观地看出所需检测的染色体之间的同源性关系。
2。5 水稻Trihelix基因在不同组织中的表达分析以及在不同激素的诱导下该基因在水稻根组织中的表达分析
此次研究主要借助了水稻全基因芯片数据[46],利用表达谱芯片分析系统(Agilent one-color (Cy3) microarray-based gene analysis system),我们分析了Trihelix基因在水稻不同组织不同时间下的表达情况,这些组织部位包括水稻的叶片、叶鞘、根、茎、穗、花药、雌蕊、外稃、内稃、胚珠、胚和胚乳。首先借助Cluster软件对Trihelix的组织表达结果进行聚类分析,再将得到的结果通过TreeView软件(http://jtreeview。sourceforge。 net/)进行Heatmap图示[47]。同时,利用水稻RiceXPRO芯片数据,获得水稻Trihelix基因家族在经过了赤霉素(Gibberellin)、脱落酸(Abscisic acid)、生长素(Auxin)、油菜素甾醇(Brassinosteroid)、细胞分裂素(Cytokinin)和茉莉酸(Jasmonic acid )六种植物激素处理数小时后的在水稻根组织中的表达结果,将得到的数据通过Cluster 3。0程序进行层次聚类分析,聚类分析的结果同样由TreeView软件进行Heatmap图示。
2。6水稻Trihelix蛋白在水稻中的互作网络
RiceFREND是一个水稻基因共表达在线分析数据库,包含水稻中来自于不同组织的大量芯片数据[46]。为深入了解Trihelix家族在水稻中的进化历程,借助RiceFREND数据库,分析水稻Trihelix与其他蛋白存在的一些互作关系,将得到的分析结果借助Graphviz(Graph Visualization Software)软件进行图示化[48]。