玉米与高粱醇溶蛋白的序列特征与正选择位点鉴定(2)_毕业论文

毕业论文移动版

毕业论文 > 生物论文 >

玉米与高粱醇溶蛋白的序列特征与正选择位点鉴定(2)


1 数据与方法
1.1基因检索与序列下载
本论文共研究了玉米醇溶蛋白基因29个,高粱醇溶蛋白19个,这些基因序列检索与下载具体方法如下:直接在NCBI数据库中查询玉米与高粱醇溶蛋白的基因,并下载这些序列;然后,以这些序列为检索序列,在Phytozome数据库中搜索这些玉米和高粱的醇溶蛋白的同源基因,并下载相关序列数据。
1.2 多序列联配与系统发生分析
利用Clustal Omega(http://www.clustal.org/omega/)在线工具对玉米和高粱的醇溶蛋白基因编码序列进行多序列联配对比,生成比对文件后用MEGA(http:/ /megasoftware.net)中的邻接算法构建系统进化树,并对进化树图片进行手工美化。

1.3 蛋白序列保守基序组成分析
采用MEME(http://meme.nbcr.net/meme/)软件鉴定玉米和高粱醇溶蛋白基因的保守基序(motif)的序列特征,具体参数设置如下:保守基序长度范围为8-165个氨基酸,保守基序个数范围为0-10个,期望值E <1e-5,其它参数设为默认。

1.4 基因的选择压力检测
为鉴定醇溶蛋白的选择压力,我们首先对禾本科植物F-box蛋白进行分类,最终得到4个类群。接下来,基于类群水平进行选择压力分析,具体过程是利用PAML(http://abacus.gene.ucl.ac.uk/software/paml.html)软件包中的CODEML软件对这些类群进行分析,然后基于贝叶斯方法推断每个氨基酸位点的后验概率。
2 结果与分析
2.1 玉米与高粱醇溶蛋白基因的鉴定
由下表我们可以得出以下结论:SbASP1的基因ID号码是Sb05g024280,位于第5号染色体的负链上,基因组匹配区段是57417233-57417919,这个基因的长度是687,ORF长度是687;SbASP2的基因ID号码是Sb05g024290,位于第5号染色体的负链上,基因组匹配片段是57420675-57426134,这个基因的长度是5460,ORF的长度是768;SbASP3的基因ID号码是Sb05g024310,位于第5号染色体的负链上,基因组匹配区段是57459648-57460451,此基因的长度是804,ORF长度是804;SbASP4的基因ID号码是Sb05g024320,位于第5号染色体的负链上,基因组匹配片段是57464180-57465044,该基因的长度是865,ORF的长度是804;SbASP5的基因ID号码是Sb05g024326,位于第5号染色体的正链上,基因组匹配片段是57492874-57506217,该基因的长度是13344,ORF的长度是189;SbASP6的基因ID号码是Sb05g024330,位于第5号染色体的正链上,基因组匹配片段是57507454-57508320,此基因和ORF的长度都是是867;SbASP7的基因ID号码是Sb05g024340,位于第5号染色体的正链上的,基因组匹配片段是5优尔6604-5优尔7470,这个基因的长度和ORF长度都是867;SbASP8这个基因的基因长度和ORF长度都是267,它的ID号码是Sb05g024400,它的位置是5号染色体的负链上;SbASP9这个基因位于第5号染色体的负链上,它的基因长度和ORF长度都是183,基因匹配片段为57588854-57589036,它的基因ID号码是Sb05g024410;SbASP10的基因ID号码是Sb05g024420,位于第5条染色体负链上,该基因组的匹配区段是57589103-57589657,它的基因长度和ORF长度是一样的,都是555;SbASP11的基因匹配区段是57857922-57858731,基因长度和ORF的长度都是810,它的基因ID号码是Sb05g024600,位于第5号染色体的负链上;基因SbASP12位于第5号染色体的负链上,它的ID号码是Sb05g024620,该基因的基因长度和ORF长度均是816,该基因的基因组匹配区段是57865264-57866079;SbASP13的基因ID号码是Sb05g024950,它位于第5号染色体的负链上,它的基因组匹配区段是58129834-58130640,该基因的基因长度和ORF长度是807;SbASP14的基因组匹配区段是58133076-58133882,它位于第5号染色体的负链上,它的基因长度和ORF长度是807,该基因的基因ID号码Sb05g024960;SbASP15的基因ID号码是Sb05g024970,它位于第5号染色体的负链上,基因组匹配区段是58136310-58137119,它的基因长度和ORF长度均是810;SbASP16和SbASP17两者的基因长度和ORF长度都是807,前者的基因ID号码是Sb05g024980,后者的基因ID号码是Sb05g024990,两者都位于第5号染色体的负链上,他IK们的基因组匹配区段分别是58139548-58140354和58142783-58143589;SbASP18的基因ID号码是Sb05g025050,它位于第5号染色体的负链上,它的基因组匹配区段是58187851-58188648,它的基因长度是798,ORF的长度是729;SbASP19的基因ID号码是Sb08g019460,它位于第5号染色体的负链上,基因组匹配区段是50226718-50227355,它的基因长度是638,ORF长度是327。ZmASP1、ZmASP2和ZmASP3三者都位于第1号染色体的正链上,他们的基因ID号码分别是AF546187.1 FG001、AF546187.1 FG007和AF546187.1 FG009,基因组匹配区段分别是161774740-161775462、161990941-161991666和162031509-162081082,基因的长度分别是723、726和49574,而其ORF长度分别为723、726和642。ZmASP24、ZmASP25、ZmASP26、ZmASP27、ZmASP28和ZmASP29基因都位于第7号染色体的正链上,他们的基因ID号码分别为AF546188.1 FG001、AF546188.1 FG002、AF546188.1 FG003、AF546188.1 FG004、AF546188.1 FG005、AF546188.1 FG006和AF546188.1 FG00,基因组匹配区段分别为18744943-18745668、18768582-18769307、18768582-18769307、18854431-18855153、18854431-18855153、18856739-18857460和18866467-18867189,优尔个基因的长度分别是726、726、725、723、722和723,ORF长度是633、456、456、723、519和723。ZmASP4的基因ID号码是GRMZM2G088273,它位于第4号染色体的正链上,它的基因组匹配区段是5075029-5076097,基因长度为1069,ORF长度是645;ZmASP5的基因ID号码是GRMZM2G088365,它位于第4号染色体的正链上,它的基因组匹配区段是5078343-5079419,基因长度是1077,ORF长度是801;ZmASP6的基因组匹配区段是5089369-5090187,它位于第4号染色体的正链上,它的基因ID号码是GRMZM2G088441,基因长度和ORF长度分别为819和408;ZmASP7的基因长度和ORF长度分别为957和399,基因ID号码是GRMZM2G388461,位于第4号染色体的正链上,基因组匹配区段是5093411-5094367;ZmASP8的基因组匹配区段是5117703-5118736,它位于第4号染色体的正链上,基因的ID号码是GRMZM2G044625,它的基因长度和ORF长度分别为1034和801;ZmASP9的基因ID号码是GRMZM2G045387,染色体位于第4号染色体的正链上,基因组的匹配区段是5122891-5123921,基因长度和ORF长度分别为1031和540;ZmASP10、ZmASP11、ZmASP13、ZmASP14、ZmASP19、ZmASP21、ZmASP22和ZmASP23均位于第4号染色体的正链上 (责任编辑:qin)