拟南芥是一种十字花科植物,广泛应用于植物遗传学、发育生物学和分子生物学研究,已成为双子叶植物分子生物学研究的模式生物[3]。目前,拟南芥中的PEX11基因及其功能还不明确。本研究采用生物信息学方法对拟南芥中的PEX11基因进行鉴定和表达分析,为其进一步功能研究奠定基础。
2 材料与方法
2。1 拟南芥PEX11基因家族成员的鉴定
从Pfam数据库(http://pfam。janelia。org)下载PEX11结构域一致性序列,利用BLASTP工具对拟南芥遗传学和基因组学数据库(TAIR, http://arabidopsis。org)进行比对搜索,得到候选蛋白;利用Pfam工具对候选蛋白序列进行检索,若存在PEX11结构域,则将其作为家族成员。利用Protparam 软件(http://expasyorg/tools/ protparam。html)计算蛋白质氨基酸数目、等电点、分子量等信息,采用WoLF PSORT(http://www。genscript。com/psort/wolf_psort。html )网站预测蛋白质亚细胞定位。
2。2 染色体分布与基因复制分析
根据拟南芥PEX11基因的座位信息,利用MapChart工具软件绘制染色体分布图。通过检索植物基因组复制数据库[4](PGDD,http://chibba。agtec。uga。edu/duplication/index/locus)查找拟南芥PEX11基因片段复制事件。如果两个基因在染色体上相距很近,间隔不超过5个基因,则认为起源于串联重复事件。
2。3 系统进化分析
利用ClustalW软件默认参数对AtPEX11氨基酸序列进行多序列比对,利用MEGA 5。1软件[5]邻接算法(Neighbor-Joining method)构建系统发育树,bootstrap重抽样进行了1000次。
2。4 基因表达分析 文献综述
利用AtPEX11基因CDS序列在National center for Biotechnology Information (NCBI, www。ncbi。nlm。nih。gov/)EST数据库中检索,取一致性大于95%、长度大于160 bp、E-value≤10-10的记录作为匹配的EST序列。对获得的记录按照组织器官的来源进行分类,统计EST数目,获取基因的表达信息。
3 结果与分析
3。1 拟南芥中的PEX11基因
利用PEX11结构域一致性序列在拟南芥遗传学和基因组学数据库中比对搜索,剔除不含完整PEX11结构域的序列,最终鉴定出拟南芥基因组中5个PEX11基因。根据基因在染色体上的位置命名为AtPEX11-1-5,下载其基本信息列于表1。从表1可以看出,该家族基因外显子数目变化较大,从1-8个不等,其中AtPEX11-2只含有一个外显子,可能起源于逆转录转座事件。AtPEX11蛋白氨基酸数变异不大,等电点分析表明所有蛋白均是碱性蛋白。蛋白质亚细胞定位预测表明,有两个蛋白(AtPEX11-2和AtPEX11-4)定位在细胞质中,一个蛋白(AtPEX11-1)定位在叶绿体中,一个蛋白(AtPEX11-3)定位在高尔基体内,一个蛋白(AtPEX11-5)定位于细胞外