把该序列GI:16973022经过Repeat Masker屏蔽后,用Genscan得出了4个CDS如下表:
表1 Genscan得出了4个CDS
CDS 转录方向 长度(length)bp 编码氨基酸个数 范围
CDS_1 正向 1215 404 17811-54702
CDS_2 逆向 978 325 61251-64025
CDS_3 正向 648 215 69308-70918
CDS_4 逆向 459 152 74101-99251
图3 Genescan得出的CDS-1的组成
从图3可以看到启动子Prom ( Promoter)、起始外显子Init(Initial exon)、内在外显子Intr(Internal exon)、末端外显子Term(Terminal exon)、末端PlyA以及其长度、位置和出现的频率等等。而CDS_1的组成不包括启动子Prom ( Promoter)和末端PlyA。
图4 Genescan得出的CDS-1的序列和编码的多肽链
从图4可以看到用Genescan得出的CDS_1的序列为1215bp和编码的多肽链的氨基酸的个数为404个,CDS_2由启动子Prom ( Promoter)、起始外显子Init(Initial exon)、内在外显子Intr(Internal exon)、末端外显子Term(Terminal exon)、末端PlyA组成,CDS_3由启动子Prom ( Promoter)、起始外显子Init(Initial exon)、末端外显子Term(Terminal exon)、末端PlyA组成,CDS_4由起始外显子Init(Initial exon)、内在外显子Intr(Internal exon)、末端外显子Term(Terminal exon)、末端PlyA组成。(具体数据见光盘)
初步判断,在该序列GI:16973022中可能存在四个基因,故要针对这4个编码序列再具体分析。
3.4 在数据库中进行序列搜索ORF核苷酸序列(Blast)
对以上得出的四段CDS进行序列搜索ORF核苷酸序列(具体数据见光盘)
3.4.1 对CDS_1进行Blast软件分析本文来自优^文'论,文·网原文请找腾讯324,9114
对CDS_1进行Blast软件分析,寻找NCBI数据库中是否有与之匹配的mRNA。
操作:进入网址 http:-//blast.ncbi.nlm.nih-gov/Blast.cgi,点击nucleotide blast(用检测序列核酸搜索核酸序列数据库),然后将CDS_1的编码序列的以fasta格式黏贴在Enter Query Sequence方框中,并选择搜索范围,Datebase为 Human genomic + transcript。然后点击Blast进行数据库搜索,得出的结果如下图所示:
上一页 [1] [2] [3] [4] [5] 下一页
人类1号染色体上DNA目标序列获取_使用Repeat Masker 软件遮蔽重复序列 第4页下载如图片无法显示或论文不完整,请联系qq752018766