1 材料与方法
1.1 序列获取及特征分析
顺乌头酸酶基因序列来自于Genebank(http://www.ncbi.nlm.nih.gov/genbank/)数据库,将获得的序列用Dnastar软件进行相似性分析、染色体定位分析、ORF分析,并对其编码蛋白的氨基酸数目、相对分子质量、等电点、蛋白质分子式进行分析。
1.2 系统树的构建
运用DNAMAN[11]软件对所得到的基因序列进行进化树的构建,并分析其序列相似性。
1.3 模式生物的顺乌头酸酶蛋白理化性质分析
利用 Protparam(http://expasy.org/ proteomics)工具预测蛋白质序列的氨基酸组成等。
磷酸化位点、信号肽预测、亚细胞定位和前导肽分析:利用 EXPASY 中的 TargetP 软件进行亚细胞定位分析,SignalP 4.0 Server 软件对其氨基酸前导肽进行信号肽预测,NetPhos 2.0 Server 预测磷酸化作用点。
二级结构、紊乱区、球蛋白区及保守域分析:利用 EXPASY中的GOR(http://npsa-pbil.ibcp.fr/cgi-bin/secpred_gor4.pl) [11]预测蛋白质的二级结构,利用GlobPlot[11](http://globplot.embl.de/)软件对顺乌头酸酶蛋白序列中的紊乱区和球蛋白区进行预测。
2 结果与分析
2.1 基因定位及蛋白信息
2.1.1 原核生物
顺乌头酸酶基因定位在鲍氏不动杆菌的TCDC-AB0715染色体上,从651507-654263;运用DNAstar软件分析可以得到:ORF在1~2757位置,长度为2757bp,用标准遗传密码翻译的蛋白质相对分子质量为100059.9,含有918个氨基酸,其中基本氨基酸(赖氨酸、精氨酸)81个,酸性氨基酸(天冬氨酸、谷氨酸)109个,疏水性氨基酸(丙氨酸、异亮氨酸、亮氨酸、苯丙氨酸、色氨酸、缬氨酸)329个,极性氨基酸(天冬氨酸、半胱氨酸、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸)226个。等电点为5.103,蛋白质熔点为82.63℃。
运用DNAstar[11]分析其它原核生物基因及其所编码的蛋白,其数据如表1所示:
表1 原核生物基因及其编码的蛋白
Table 1 Prokaryotes gene and its encoding protein
基因 染色体定位 ORF 氨基酸个数 相对分子质量 PI 分子式
鲍氏不动杆菌gi|385235550 TCDC-AB0715 651507-654263 1-2757 918 100059.9 5.25 C4455H7026N1206O1355S28
结核杆菌gi|448814763 H37Rv c1666046-1663215 256-2832 858 92994.6 4.87 C4131H6406N1128O1276S22
蓝细菌gi|428771848 PCC 7202 c1101543-1098940 1-2604 867 93971.8 4.89 C4155H6628N1112O1279S42
长双歧杆菌gi|479134917 F8 918817-921516 1-2700 899 97555.2 4.66 C4335H6779N1157O1351S26
支原体gi|440285501 FGI 57 c3901019-3898422 79-2598 839 90478.9 5.15 C4035H6413N1085O1210S31
由分析结果可知,鲍氏不动杆菌的顺乌头酸酶基因定位在TCDC-AB0715染色体上,编码区在651507-654263之间,其编码的蛋白分子式为C4455H7026N1206O1355S28;结核杆菌定位H37Rv染色体上,编码区在c1666046-1663215,编码的蛋白分子式为C4131H6406N1128O1276S22;蓝细菌定位在 PCC 7202染色体上,编码区在c1101543-1098940,编码的蛋白分子式为C4155H6628N1112O1279S42;长双歧杆菌定位在F8 染色体上,编码区在918817-921516, 编码的蛋白分子式为C4335H6779N1157O1351S26 ;支原体定位在FGI 57染色体上,编码区在c3901019-3898422,编码的蛋白分子式为C4035H6413N1085O1210S31。原核生物顺乌头酸酶蛋白的氨基酸数目在800~900之间,其等电点在4.5~5.5之间,相对分子质量在90000到100000之间,蛋白质由C、H、O、N、S五种元素组成;均为酸性蛋白。 顺乌头酸酶基因的进化分析+文献综述(2):http://www.youerw.com/shengwu/lunwen_7141.html