摘 要随着人类基因组计划和一些模式生物基因组计划的完成,公共数据库中生物数据的增长速度越来越快。如何从海量的生物数据中解读、提取和获得有用的生物信息,已成为基因组计划下一步亟待解决的问题。生物信息学作为一门崭新的交叉学科,它的研究内容非常丰富。本文的研究内容主要有以下两个部分:
在第二章中,我们主要对DNA 序列和蛋白质序列的图形表示方法进行了综述。首先,我们简单介绍了DNA序列的2-D、3-D等图形表示方法;然后我们介绍了蛋白质序列的图形表示方法;最后我们总结了图形表示方法在生物信息学应用中的数值刻画方法。
在第三章中,我们对DNA序列的“四水平线”图形表示方法进行了推广,基于20种氨基酸的 5字母模型,提出了一种新的蛋白质序列的图形表示方法,这种方法使得含有20种氨基酸的蛋白质序列在应用中的复杂操作变得简化。5325
关键词:生物信息学;图形表示;数值刻画;DNA 序列;蛋白质序列;
The study of the graphical representation methods of biological sequences
Abstract
The main contents are listed as follows:
In Chapter two, we mainly sum up graphical representation method of DNA sequences and protein sequences. Firstly, we simply introduce the method of representing DNA sequence of 2-D, 3-D and other graphics. Then we introduce the method of representing protein sequence pattern. At last, we sum up the graphical representation method of describing method in numerical applications in information biology .
In Chapter three, we mainly introduce the graphical representation of protein sequence. Because the protein sequence is different from DNA sequence. We have to consider twenty kinds of character string. So it’s more complex than DNA sequence which is showed by four kinds of character string. But for complex problems, human beings always use the easier way to solve .The way is five letter model which is mentioned in the last chapter. Simplify the protein sequence and give people new graphics.
 Keywords: DNA sequences, quotient matrices, normalized leading eigenvalue, similarity, protein sequence,5 letter model
 目  录

1  绪   论    5
1.1 研究的背景及意义    5
1.2 生物信息学的研究对象    6
1.2.1 核酸    7
1.2.2 蛋白质    8
1.2.3 中心法则    9
1.3 生物信息学的主要研究内容    11
1.3.1 序列比较    11
1.4 本文的主要工作    12
2  生物序列图形表示的综述    13
2.1  DNA序列的图形表示    13
2.1.1 2-D图形表示    13
2.1.2 3-D图形表示    15
2.1.3 其他图形表示    17
2.2 蛋白质序列的图形表示    17
2.3数值刻画    19
2.3.1 矩阵表示    19
2.3.2 序列不变量    19
3  基于5-字母模型的蛋白质序列图形表示方法    20
3.1 五字母表示模型    20
3.2 一种新的蛋白质序列图形表示    21
4  总结    23
参 考 文 献    24
致   谢    26
1 绪论
随着生物技术特别是分子生物学技术的快速发展,科学家们获得了大量物种的基因序列。尤其是随着人类基因组计划(HGP)实施的进一步深入,为生物学研究提供了大量的人类基因数据,生命科学已步入后基因组时代。这样,就需要我们对这些己有的生物信息进行加工、储存、分配、分析、释读、搜索和恢复。正是在这种情况下,一门由生物学、数学、信息科学、计算机科学和系统科学相交叉的新兴学科应运而生,即生物信息学。目前,生物信息学己成为整个生命科学发展的重要组成部分。
上一篇:配煤槽水分分布模型的有限差分解法
下一篇:MATLAB期权数值解算法及股票预测模型

浅谈中学数学函数最值问题的求解方法

基于决策树算法的篮球联赛预测

数形结合在中学数学中的...

浙江省工业企业发展的因子分析

中美小学数学课堂教学的比较

杭州历年中考三角形的题型分析

论数形结合在中学数学教育中的应用

神经外科重症监护病房患...

国内外图像分割技术研究现状

公寓空调设计任务书

承德市事业单位档案管理...

医院财务风险因素分析及管理措施【2367字】

C#学校科研管理系统的设计

AT89C52单片机的超声波测距...

10万元能开儿童乐园吗,我...

志愿者活动的调查问卷表

中国学术生态细节考察《...