茄子(Solanum melongena L)不仅是重要的蔬菜作物,而且常被用于遗传学与分子生物学研究中,植物学分类上它归属于茄科茄属[8]。随着茄子全基因组测序完成[9],利用生物信息学手段从全基因组水平上挖掘与分析茄子重要基因或基因家族已经成为一种快速便捷的常用方法。尽管模式植物拟南芥、水稻等WRKY基因已有较多的研究报道[10],但迄今为止,茄子这些基因的相关研究未见报道。本文详细分析了茄子WRKY基因的序列与系统进化分析,为进一步鉴定茄子WRKY基因功能和阐明其进化起源奠定了基础。
1 数据与方法
1.1 茄子WRKY基因检索与序列下载
直接从TAIR(https://www.arabidopsis.org/index.jsp)数据库中下载模式植物拟南芥(Arabidopsis thaliana)的WRKY基因,共得到72个WRKY家族成员。以拟南芥WRKY基因序列为探针,利用BLAST工具在茄子基因组数据库(http://eggplant.kazusa.or.jp/)中检索WRKY家族的候选基因,并下载这些WRKY家族基因成员的蛋白序列,将这些蛋白序列提交到Pfam工具(http://pfam.xfam.org/)进行功能结构域鉴定,最后将含有WRKY类型DNA结合结构域的蛋白作为WRKY家族的成员,总共获得74个茄子WRKY基因,并下载这些基因的基因组、编码区和蛋白序列。
1.2 茄子WRKY基因序列比对与系统发生关系分析
为探索茄子WRKY基因的系统发生关系,选用74个茄子WRKY基因用于构建进化树。多序列联配由ClustalW2(https://www.ebi.ac.uk/Tools/msa/clustalo/)完成,参数设置为默认值,然后保存比对结果文件。接下来,将比对结果文件提交到MrBayes在线工具(http://www.phylogeny.fr/),利用贝叶斯方法构建系统发生树,其进化树图片直接输出。
1.3 茄子WRKY蛋白保守基序组成模式分析
利用MEME(http://meme.nbcr.net/meme/)软件鉴定茄子WRKY蛋白的保守基序(motif)的序列特征,参数设置如下:保守基序长度范围为9-185个氨基酸,保守基序个数范围为0-10个,期望值E <1e-5,其它参数设为缺省值。
1.4 茄子WRKY蛋白的选择压力检测
对茄子的WRKY家族基因进行两两比较,筛选出茄子WRKY家族的旁系同源基因对。利用Pal2nal工具(http://www.bork.embl.de/pal2nal/)计算所有旁系同源基因对的dN、dS和ω值。然后,利用画图工具Adobe illustrator绘制这些旁系同源基因对Ka、Ks和ω值的分布图。根据分布图推断,茄子旁系同源基因对受到的选择压力类型,并判断这些同源基因对分化后是否经历了适应性进化。
2 结果与分析
2.1 茄子WRKY家族基因的鉴定
从eggplant中检索WRKY基因,共得到74个相关的WRKY基因。然后依次命名为SmWRKY1-74.结果显示:74个WRKY基因广泛的分布在茄子不同染色体上。出WRKY 2转录因子长度为23085外,剩余的73个WRKY基因长度均分布在1000-10000之间。 茄子WRKY转录因子家族基因的鉴定与系统进化分析(2):http://www.youerw.com/shengwu/lunwen_30278.html