HHblits高精度二硫键网络预测及其应用(2)
时间:2022-03-06 10:17 来源:毕业论文 作者:毕业论文 点击:次
3
1。2 二硫键预测问题 4 1。3 二硫键预测方法 4 1。4 本文组织结构 5 2 研究使用数据集以及方法 6 2。1 数据集 6 2。2 预测系统结构设计 6 2。3 特征提取 7 2。3。1 PSSM 位置特异性得分矩阵特征 8 2。3。2 PSS 预测的二级结构特征 8 2。3。3 DOC 序列氧化半胱氨酸之间的距离特性 8 2。3。4 CM 相关的突变系数特性 9 2。3。5 总结 9 2。4 基于序列匹配的确信二硫键检测 9 2。5 基于三维结构的确信二硫键检测 9 2。6 机器学习方法获得二硫键图中权值 10 2。6。1 机器学习方法使用介绍 10 2。6。2 使用 Random Forest 回归算法得到权值 10 2。6。3 使用 DNN 深度学习算法得到权值 11 2。7 最大权值匹配 11 3 主要方法介绍 12 3。1 Deep Neural Networks 12 3。1。1 深度神经网络结构 12 3。1。2 ReLUs 非线性激活函数 12 3。1。3 Dropout 操作 14 3。2 HHBlits 序列匹配算法 16 3。2。1HHblits 算法介绍 16 3。2。2HHblits 算法流程 16 3。2。3 HHblits 进行确信二硫键预测方法 18 3。3 Modeller 三维建模算法 18 3。3。1Modeller 算法介绍 18 3。3。2Modeller 算法流程 19 3。3。3 Modeller 进行确信二硫键预测方法 20 3。4 总结 20 4 实验结果及分析 20 4。1 评判标准 20 4。2 基准数据集结果 21 4。2。1 Modeller 和 HHblits 模型结果 21 4。2。2 DNN 模型参数修改优化过程 21 4。2。3 结果与现有方法比较 22 结 论 23 致 谢 24 参 考 文 献 25 1 引言 众所周知,蛋白质的三维(3D)结构对其生物功能有密切的关系。在后基因组时代,由于 先进的测序技术和协调一致的基因组项目的快速发展,没有结构信息的大量的蛋白质测序已 经广泛积累。因此,迫切需要通过只序列中准确预测蛋白质结构来构建蛋白质序列和结构的 桥梁。在过去几十年里,人们做出了相当大的努力从蛋白质序列中获取信息预测 3D 结构, 其中已经有很多激动人心的成果。然而,直到现在,直接从序列预测一个完整的三维结构还 远远不能成功,仍然是一个具有挑战性和开放的问题。在这方面,研究人员采取分解完整的 3D 结构的预测成特殊结构段或特性的预测,诸如无序区域,跨膜螺旋,β-折叠,残留接触 图,二硫键的连接,溶剂可达性,等等。从蛋白质结构段或特性所得到的知识可以提供关于 蛋白质三维结构有价值的方法,也可以有助于了解蛋白质的功能。 论文网 (责任编辑:qin) |