而推出的 TargetDisulfide 工具也使现有的二硫键连接预测工具领域更加充实。
1.3.2 本文内容安排
本文一共分为 5 个章节,每个章节的内容如下
第 1 章,绪论:二硫键是最重要的蛋白质结构特性之一,本章介绍了二硫键的预 测对于理解蛋白质的结构和功能的重要作用。接着对国内外二硫键模式研究情况做了 介绍,也对本研究做了简要的介绍。
第 2 章,特征提取:特征提取在以机器学习为基础的预测器中是一个重要组成部 分,本章重点介绍了我们从预测的蛋白质三维结构中提取的新特征,同时也对现有预 测工具所使用的经典特征做了简要说明。接着说明了所尝试的特征选择方法,以达到 降维并消除冗余的目的。来!自~751论-文|网www.751com.cn
第 3 章,回归模型:在选择回归模型部分,经过对比,我们选择了实验结果较好 的支持向量回归和随机森林两个模型作为预选模型,分别进行实验。同时也对两个模 型的基本原理做了简单概述。然后我们整合上一章所述的特征提取工作和本章所选择 的两个回归模型,作出我们方法的流程图并加以说明。
第 4 章,实验结果与分析。为了客观的与以往的研究进行比对,我们首先介绍了
先前所使用的两个预测性能评价指标: Q 和 Q 。并且对所使用的两个标准数据集
进行了说明,另外还详细介绍了自构建的独立测试集的筛选条件。接着,从交叉验证 和独立验证两个方面,分别与现有工具比较,证明了所提工具的优越性。最后通过案 例分析列举两个蛋白质在是否加入我们新提出特征情况下的预测结果,证明新特征的 有效性。