从上图由搜索结果可知,该编码序列有存在很多mRNA与未知CDS_1相似,选择其中NM_014697.2 和BC112295.1两条mRNA进行比对看具体的情况。
3.4.2 对CDS_2进行Blast软件分析
对CDS_2进行Blas
hindi sms http://www.hindisms-hindi.com/ t软件分析得出的结果如下图所示:
图6 Blast CD-2
3.4.3 对CDS_3进行Blast软件分析对CDS_3进行Blast软件分析得出的结果如下图所示:
图7 Blast CD-3
3.4.4 对CDS_4进行Blast软件分析
对CDS_4进行Blast软件分析得出的结果如下图所示:
图8 Blast CD-4
从以上的数据可以看出每一个CDS都有很多mRNA或cDNA与其相似,所以把每一个CDS选择的结果总结如下表:
表2 选择结果
Unkown CDS 长度(bp) VERSION 长度(bp)
CDS_1 1215 NM_014697.2 4464
BC112295.1 1634
CDS_2 978 NM_182581.3 1173
CDS_3 648 NM_001135240.1 984
CDS_4 459 NM_053282.4 2553
AK31743.1 468
3.5 进行目标序列与搜索得到的相似序列的整体比对(global alignment)
3.5.1 将CDS_1与NM_014697.2进行ClustalW2(Multiple Sequences Alignment)和Blast2分析。
进入网址:http:-//www.ebi.ac-uk/Tools/msa/clustalw2/,在step1中选择DNA sequence,并将CDS_1和NM_014697.2的fasta格式同时黏贴到下面的方框,没有对Step2、3、4做选择,直接点击submit提交序列。结果具体见光盘。
把未知的CDS_1与Accession:NM_014697.2进行Clustal W2比对,可以看出:
前端:未知CDS_1缺少730左右个碱基。
中间部分:未知的CDS_1多出了24个碱基(Accession:NM_014697.2上969-993之间)
后端:未知CDS_1缺少2256个碱基。
3.5.1.1 对后端
hindi sms http://www.hindisms-hindi.com/ 序列进行分析: 本文来自优^文'论,文·网原文请找腾讯3249.114
图9 CDS_1与NM_014697.2 ClustalW2结果
把未知的CDS_1的后端进行补齐,从原序列中找CDS_1之后的碱基。由Genscan的结果可知:CDS_1的末端和CDS_2的起始端之间的碱基号从54688—61251之间,在这之间的碱基经过多次的软件ClustalW2分析我选择从54688-57300之间的碱基共2613个,与Accession:NM_001135240.1的序列从1894—4464之间的2572个碱基用ClustalW2数据库进行局部比对,得出的结果如上图,可以得出2572个碱基完全匹配,(即Accession:NM_001135240.1的序列从1894—4464之间的碱基完全匹配),而且用Blast2的结果Max ident和Query coverage都为100%。(具体数据见光盘)
上一页 [1] [2] [3] [4] [5]
人类1号染色体上DNA目标序列获取_使用Repeat Masker 软件遮蔽重复序列 第5页下载如图片无法显示或论文不完整,请联系qq752018766