摘要:在生物信息学的研究过程中最需要做的就是有大量基础信息的支撑,特别是那些有价值的信息。文章在进行研究的时候主要的研究对象是基因表达谱以及信号肽。在实际的研究过程要找到切实有效的分类算法。71521
在实际的临床医学研究上面基因表达谱是一种又快又有效的诊断肿瘤的方法,主要的原因就是基因表达谱的特点是高维数、小样本以及噪音大,这些特点的存在就使得在分类上具有很大的困难。在基因治疗方面的研究上信号肽已然发挥着越来越重要的作用,但是随着新蛋白质在后基因时代的快速发展也就使得新信号肽序列识别成为了生物医学工程研究的当务之急。在进行实际的研究当中提出了一个非常重要的预测方法就是在贝叶斯推理网络基础上的Singnal--BNF的预测方法。这个算法在输入的时候就是要将许多个不同特点的数据集合作为基础。其次就是在结果的产生上面要不断的使权重投票系统与贝叶斯基分类器两者相互融合产生不一样的结果。
毕业论文关键词:贝叶斯分类器 基因表达普 信号肽 Singnal—BNF
Abstract: in the process of bioinformatics, most need to do is to support a large number of basic information, especially those with valuable information. In the study, the main research object is the gene expression profile and signal peptide. In the actual research process to find effective classification algorithm.
In actual clinical medical research on gene expression profile is a fast and effective diagnostic method, the main reason is the gene expression spectrum characteristics of high dimensions, small samples and noise, the existence of these characteristics makes has great difficulty in classification. In gene therapy research on signal peptide already plays a more and more important role, but with the rapid development of new proteins in the post genome ra also makes new signal peptide sequence identification has become the urgent matter of the biomedical engineering research. A very important forecasting method is proposed in this study, which is based on Bayesian inference network Singnal--BNF. This algorithm is based on the data set of many different features in the input. The second is that the results of the above to continue to make the weight of the voting system and the Bias Ki classifier fusion of the two are not the same results.
Keyword: Bias classifier gene expression signal peptide Singnal--BNF
目录
1 绪论 4
1.1 生物信息学 4
1.2 课题研究意义 4
2 研究对象和模式识别基本理论 4
2.1 本章主要研究对象 4
2.1.1 基因表达谱 5
2.1.2 蛋白质序列以及信号肽 5
2.2 模式识别基础 6
2.3 本章小结 7
3 基于贝叶斯分类器的结肠癌数据分类 7
3.1 贝叶斯分类算法 7
3.1.1 贝叶斯网络 7
3.1.2 贝叶斯分类器 8
3.2 肿瘤基因表达谱分类模型 8
3.2.1 肿瘤基因表达谱分类模型 8
3.2.2 改善的肿瘤基因表达谱分类模型 9
3.3 实验分析