甘薯RNA结合蛋白的生物信息学预测分析(2)
时间:2021-11-30 19:55 来源:毕业论文 作者:毕业论文 点击:次
近年来,随着计算机信息学的发展和生物技术的进步,人们应用生物信息学的方法对RNA结合蛋白进行预测,并推测其在基因调控方面的作用,使得对RNA结合蛋白在基因调控方面的功能认识得到了极大的加强[1]。而甘薯拥有一套RBPs系统,它们参与调控了诸多过程如对环境改变的适应、花的形成等,然而目前对于RBPs如何调控这些过程的研究依旧知之甚少,如花期调控蛋白FCA通过选择性剪切和多腺苷酸化的负调控机制表达[1]。因此,本文对甘薯RBPs进行生物信息学预测和分析,集中讨论在甘薯的生长发育和胁迫反应中起着重要作用的几个RBPs家族,包括GRP、RBP、ZFP、PPR和RH等,并对这几种RBPs的基因结构、进化关系、结构域和磷酸化残基进行预测和分析,进一步研究RNA结合蛋白在甘薯生长、发育和胁迫过程中的功能,并为最终培育RNA结合蛋白转基因甘薯奠定理论基础。 1。综述 1。1 RBPs的结构特点 在已发现的所有真核生物中,RRM是最好的RNA结合蛋白基序并且许多RBPs在N端区域具有一个或两个RRMs[2]。典型的RBPs包含在C-末端的辅助域或基序,包括富含甘氨酸结构域,锌指结构域,富含精氨酸结构域,RD重复和SR重复,这些辅助域或基序确定了RBPs对靶向RNA的结合特异性。在这些RBPs中,GRPs在植物中丰富度较高,并且拟南芥和水稻基因组分别含有8个或6个GRP基因。GRPs在N-末端含有一个典型的RRM,在C-末端含有一个甘氨酸富集区(图1)。在富含甘氨酸区,GRPs含有一个额外的CCHC型锌指结构,特指为已在拟南芥和水稻中发现的RZs[3]。拟南芥和水稻基因组含有三个RZ基因,并且AtRZs和OsRZs的氨基酸序列相似性达到约40%,同时还含有保守的CCHC型锌指结构域(图1)。 冷休克结构域(CSD)是在真核生物的Y-box蛋白中发现的,并且具有结合RNA、单链DNA和双链DNA 的能力[4]。相反,除了N-末端的CSD ,细菌的冷休克蛋白(CSP)只包含CSD,典型植物CSDPs拥有穿插几个CCHC型锌指结构的C-末端甘氨酸富集区(图1)[5]。四个基因编码的CSDPs已在拟南芥和水稻基因组中被识别。RHs分为六个超家族(SF1-SF6), 并且每个RH都有明确的九个功能域(Q, I, IA, IB, II, III, IV, V, VI)(图1)。在RHs中,DEAD-box RHs是SF2解旋酶的最大家族而且具有保守的Q功能域和解旋酶活性。拟南芥和水稻基因组大约分别编码58和50个DEAD-box RHs。 在原核生物中,首先研究了CRM蛋白,如古菌和细菌,并根据它们的序列相似性和结构域分为四类。CRM结构域与细菌YhbY同源,并与包含在CRM结构域环中的一个高度保守的GxxG序列的KH RNA结合结构域相似(图1)[6]。许多CRM域包含蛋白定位于叶绿体或线粒体中并在植物的内含子组Ⅰ或组Ⅱ的剪接中发挥重要作用[7]。文献综述 其具备S1的RNA结合结构域的SDPs具有RNA结合能力,参与RNA的降解和蛋白质的合成 [8]。大肠杆菌S1蛋白由六个S1结构域折叠成五股反平行β barrel,主要参与RNA结合(图1)。SDPs广泛存在于各种生物体中,但只有少数几个SDPs的功能用作植物研究,包括通过E/ G型核糖核酸内切酶、外切体亚单位(atrrp4p)和质体转录的RNA加工和降解[9]。 由35个氨基酸序列的串联重复所组成的PPR蛋白折叠成一对平行的α螺旋(图1)[10]。重要的是,PPR蛋白在陆地植物中很丰富并主要定位于叶绿体或线粒体等细胞器 [11]。植物PPR蛋白分为两大亚科P- 和 PLS科(P功能域:35个氨基酸,L功能域:36个氨基酸,与S功能域:31个氨基酸)并通过识别核酸底物特异性序列参与RNA代谢[12]。蛋白质组分析表明,拟南芥和水稻基因组分别编码450个和650个以上的PPR蛋白,而原核生物和人类却不足7个PPR蛋白[13]。 (责任编辑:qin) |