DNA具有双螺旋结构,该结构模型是由Watson和Crick在1953年提出的。DNA蕴含的复制结构的关键特征是互补基对。这就是著名的Watson-Crick配对,即A与T配对,G与C配对。这种配对是由于氢键作用,原理是DNA单链(按5’到3’的次序)与相反方向的互补的链配对。
图1-2:五种碱基A, G, C, T, U的分子结构示意图
Fig.1-2:The molecular structure of 5 kind of bases A, C, G, T and U
RNA和DNA不同,它是单链分子。RNA主要有3种,即信使RNA(mRNA),核糖体RNA(rRNA)及转运RNA(tRNA)。RNA虽然是单链分子,但它却经常通过自身回折使链中碱基配对从而形成多端的双股螺旋区,这就构成了RNA分子的二级结构[2]。
1.2.2 蛋白质
蛋白质是生物体内占有特殊地位的生物大分子,它是生物体的基本构件,也是生命活动的重要基础。生物体内的蛋白质种类繁多,结构各异,功能也多种多样。
氨基酸(amino acid)是蛋白质的基本结构单位。氨基酸是带有氨基的有机酸,自然界中的氨基酸种类很多,但参与蛋白质组成的常见氨基酸只有20种,这20种氨基酸中,除脯氨酸外,均可用图1-3的通式表示:
图1-3:氨基酸分子结构示意图
Fig.1-3: Structural representation of amino acid molecule
氨基酸在结构上的共同点是中心碳原子为 碳( )各种 -氨基酸的区别在于R基团不同,R基团的特异性使不同氨基酸显示出不同的理化性质,进而决定了氨基酸在蛋白质分子的空间结构中可能的位置。20种标准氨基酸的英文简写见表1-1。
核酸是遗传信息的携带者,而蛋白质是信息转化为生物结构和功能的表达者。蛋白质的分子结构有不同的层次,为了研究方便,人们将其分为四个层次:
蛋白质的一级结构。氨基酸在多肽链中的排列顺序(包括氨基酸的种类、数量)和方式叫做蛋白质的一级结构。如图1-4。
图1-4:一个肽键的形成
Fig.1-4:the form of a peptide bond
各氨基酸由肽键连接而成的产物称为肽(peptide)。蛋白质分子中的氨基酸都是按一定的排列顺序组成的多肽链(polypeptide chain)。多肽链是有方向的,一条多肽链在其中一个末端含有一个游离的氨基,称为氨基端(amino terminus)或N-端;另一末端含有一个游离的羧基,称为羧基端(carboxy terminus)或C-端。蛋白质的一级结构也叫初级结构或化学结构。
蛋白质的二级结构。多肽链中的一个肽键和相隔若干个氨基酸残基的另一个肽键之间形成氢键,这些氢键使蛋白质分子中的部分多肽链盘旋成螺旋状,或者折叠成片层状,或者形成180度的回折。这种多肽链本身的折叠和盘绕方式构成了蛋白质的二级结构。蛋白质的二级结构是蛋白质的基本空间构型。二级结构中主要有两类: 螺旋和 折叠。
蛋白质的三级结构。具有二级结构的多肽链还可以借助氢键和其他化学键(如离子键、二硫键等)进一步卷曲、折叠,形成复杂的空间构象,这种空间构象叫做蛋白质的三级结构。
蛋白质的四级结构。有些蛋白质是由两条或两条以上具有三级结构的多肽链组成的,这时每条肽链被称为一个亚基。几个亚基之间通过氢键或其它化学键形成一定的空间排列。这种由两个或两个以上具有三级结构的亚基聚合而成的构象是蛋白质的四级结构。
蛋白质是组成生物体的基本物质,是生命活动的主要承担者,一切生命活动都与蛋白质有关。生物信息学的一个基本观点是:分子的结构决定分子的性质和分子的功能。因此,蛋白质的空间结构决定蛋白质的生物学功能。对于蛋白质的各层次结构之间的关系而言,一级结构是生物信息学中一个非常基础而又重要的内容。为了尽可能多的挖掘出蛋白质序列中包含的信息,一些学者给出了蛋白质的图形表示。 数学模型在生物信息学中的应用(3):http://www.youerw.com/shuxue/lunwen_13055.html