生物序列的图形表示方法研究+文献综述
时间:2017-01-16 19:35 来源:毕业论文 作者:毕业论文 点击:次
摘 要随着人类基因组计划和一些模式生物基因组计划的完成,公共数据库中生物数据的增长速度越来越快。如何从海量的生物数据中解读、提取和获得有用的生物信息,已成为基因组计划下一步亟待解决的问题。生物信息学作为一门崭新的交叉学科,它的研究内容非常丰富。本文的研究内容主要有以下两个部分: 在第二章中,我们主要对DNA 序列和蛋白质序列的图形表示方法进行了综述。首先,我们简单介绍了DNA序列的2-D、3-D等图形表示方法;然后我们介绍了蛋白质序列的图形表示方法;最后我们总结了图形表示方法在生物信息学应用中的数值刻画方法。 在第三章中,我们对DNA序列的“四水平线”图形表示方法进行了推广,基于20种氨基酸的 5字母模型,提出了一种新的蛋白质序列的图形表示方法,这种方法使得含有20种氨基酸的蛋白质序列在应用中的复杂操作变得简化。5325 关键词:生物信息学;图形表示;数值刻画;DNA 序列;蛋白质序列; The study of the graphical representation methods of biological sequences Abstract The main contents are listed as follows: In Chapter two, we mainly sum up graphical representation method of DNA sequences and protein sequences. Firstly, we simply introduce the method of representing DNA sequence of 2-D, 3-D and other graphics. Then we introduce the method of representing protein sequence pattern. At last, we sum up the graphical representation method of describing method in numerical applications in information biology . In Chapter three, we mainly introduce the graphical representation of protein sequence. Because the protein sequence is different from DNA sequence. We have to consider twenty kinds of character string. So it’s more complex than DNA sequence which is showed by four kinds of character string. But for complex problems, human beings always use the easier way to solve .The way is five letter model which is mentioned in the last chapter. Simplify the protein sequence and give people new graphics. Keywords: DNA sequences, quotient matrices, normalized leading eigenvalue, similarity, protein sequence,5 letter model 目 录 1 绪 论 5 1.1 研究的背景及意义 5 1.2 生物信息学的研究对象 6 1.2.1 核酸 7 1.2.2 蛋白质 8 1.2.3 中心法则 9 1.3 生物信息学的主要研究内容 11 1.3.1 序列比较 11 1.4 本文的主要工作 12 2 生物序列图形表示的综述 13 2.1 DNA序列的图形表示 13 2.1.1 2-D图形表示 13 2.1.2 3-D图形表示 15 2.1.3 其他图形表示 17 2.2 蛋白质序列的图形表示 17 2.3数值刻画 19 2.3.1 矩阵表示 19 2.3.2 序列不变量 19 3 基于5-字母模型的蛋白质序列图形表示方法 20 3.1 五字母表示模型 20 3.2 一种新的蛋白质序列图形表示 21 4 总结 23 参 考 文 献 24 致 谢 26 1 绪论 随着生物技术特别是分子生物学技术的快速发展,科学家们获得了大量物种的基因序列。尤其是随着人类基因组计划(HGP)实施的进一步深入,为生物学研究提供了大量的人类基因数据,生命科学已步入后基因组时代。这样,就需要我们对这些己有的生物信息进行加工、储存、分配、分析、释读、搜索和恢复。正是在这种情况下,一门由生物学、数学、信息科学、计算机科学和系统科学相交叉的新兴学科应运而生,即生物信息学。目前,生物信息学己成为整个生命科学发展的重要组成部分。 (责任编辑:qin) |