3.3.1 数据来源和实验方法 9
3.3.2 实验结果与分析 9
3.4 本章小结 10
4.1 预处理数据集 11
4.1.1 实验数据集 11
4.1.2 蛋白质序列编码 11
4.2 Signal--BNF算法 12
4.3 实验结果及分析 12
4.4 本章小结 13
5 应用探究 14
5.1 蛋白质序列编码 14
5.2 旋转森林 15
5.3 序列比对 15
5.4 本章小结 16
总结 17
参考文献 19
1 绪论
1.1 生物信息学
在探索到的生命体当中大多数都是由细胞来构成的,所以说在生命科学的研究上面不只是要对宏观事物的探索同时也是对微观事物的观察。在实际的观察当中会找到细胞当中在很多共性,细胞都是经历了有产生直至死亡的一个过程,并且在这个过程当中每个细胞都经历了自身的完整复制。论文网
在对于细胞的研究当中可以看到细胞在表面上是非常复杂的,但是在其中也是存在很多的相类似的组织规则的,比如DNA、RNA以及蛋白质。这三者就是构成一个生命体的最为重要的元素。在信息科学技术不断发展的今天,对于生物学数据的研究和存储也有了较大的完善。人类基因的测序工作也随着HGP计划的完成而完成了,人们对于基因的认识也逐渐的发展到了一个崭新的高度。当然随着新的生物学技术的发展,数据的数量也是在逐渐增加的,所以在数据的处理上和数据关系的挖掘上尤为重要。
生命科学的研究是一个逐步深入的过程,在研究期间大量的数据会出现在生物数据库当中,这样会给数据的处理产生非常大的压力,针对这样的情况存在就会有新的应对方式来进行数据的处理,比如自动分析这一模式。这样综合信息的处理就会产生一门新的学科就是生物信息学。
1.2 课题研究意义
在对生物信息数据的研究上面数据数量的增长是一个不容忽视的问题,在大量的数据中找到切实有用的数据是一个非常复杂的过程,所以在实际的研究过程中这也就成为了一个非常需要去解决的问题。这一问题的就解决对于数据的挖掘和利用有着很深刻的意义。文章主要的研究对象就是生物信息学中的基因表达谱以以及信号肽,通过对于两者的研究可以十分有效的处理分析过程中产生的海量数据,对于数据的准确性有着较大的意义。信号肽在新合成蛋白质可以帮助其到达目标所在的位置,产生较大的指导作用,信号肽序列是有一定的规则的,一旦有所改变那就意味着将会有各种各样的疾病产生。对于信号肽的研究已然成为了现代分子细胞学的研究的重要组成部分。
2 研究对象和模式识别基本理论
2.1 本章主要研究对象
2.1.1 基因表达谱
分子生物学在发展中是需要大量的数据来作为发展基础的而DNA微阵列技术的不断完善就为分子生物学的研究提供了可能。在实质性的研究中对于基因表达谱的获得是需要进行基因芯片的实验的。在所研究的基因芯片上面要做的就是将每一个基因的表达值进行监测,然后将每个数据进行适当的组合,这样才会最终得到想要的研究结果。来!自-优.尔,论:文+网www.youerw.com