
    摘要二硫键是蛋白质的关键结构特性之一。准确定位二硫键有助于更好地理解蛋 白质的结构和功能。在后基因时代,大量结构与功能未知的蛋白质序列正在快速 累积,研发从蛋白质序列直接预测二硫键连接模式的方法具有重要意义。本研究 在传统的用于蛋白质二硫键预测的特征基础上,提出了从预测的蛋白质三维结构 中提取空间距离信息特征,以提高二硫键预测的性能;此外,还基于蛋白质图像 表示,使用特征选择技术来降低特征维数并消除冗余。在标准数据集上的交叉验 证和独立测试结果表明,所提的方法优于现有的基于序列的蛋白质二硫键预测工 具。68474

    毕业论文关键词 蛋白质结构预测; 二硫键连接预测; 特征提取; 随机森林

    Title Disulfide Connectivity Prediction based on Image Representation




    Disulfide connectivity is one of the most important protein structure characteristics. Accurately predicting disulfide connectivity solely from protein sequence helps to improve the intrinsic understanding of protein structure and function, especially in the post-genome era where large volume of sequenced proteins without being functional annotated is quickly accumulated. In this study, a new feature extracted from the predicted protein 3D structural information is proposed and integrated with traditional features to form discriminative features. we also tried some feature selection method introduced from image processing field to remove redundant information. Based on the extracted features, random forest regression model is taken to perform protein disulfide connectivity prediction. We compared the proposed method with popular existing predictors by performing both cross-validation and independent validation tests on benchmark datasets. Experimental results demonstrate the superiority of the proposed method over existing predictors. We believe the superiority of the proposed method benefits from both the good discriminative capability of the new developed feature and the powerful modelling capability of the random forest.




    Keywords Protein structure prediction; Disulfide connectivity prediction; Feature extraction;      Random forest

    1 绪论 1

    1.1 研究背景及意义 1

    1.2 研究现状 2

    1.3 本研究概及本文内容安排 3

    1.3.1 本研究概况 3

    1.3.2 本文内容安排 4

    2 特征提取 5

    2.1 特征表示 5

    2.2 特征选择 7

    3 预测模型 10

    3.1 回归模型的选择 10

    3.2 工作流程 11

    4 实验结果与分析 14

    4.1 衡量指标

  1. 上一篇:基于人体检测的异常行为识别
  2. 下一篇:基于网页分析和抓取技术的金融数据采集系统
  1. 基于MATLAB的图像增强算法设计

  2. 基于Kinect的手势跟踪与识别算法设计

  3. JAVA基于安卓平台的医疗护工管理系统设计

  4. 基于核独立元分析的非线...

  5. 基于Hadoop的制造过程大数据存储平台构建

  6. 基于安卓系统的测量软件...

  7. 基于VC++的GIS矢量图形系统开发

  8. 电站锅炉暖风器设计任务书

  9. 杂拟谷盗体内共生菌沃尔...

  10. 当代大学生慈善意识研究+文献综述

  11. 乳业同业并购式全产业链...

  12. 酸性水汽提装置总汽提塔设计+CAD图纸

  13. java+mysql车辆管理系统的设计+源代码

  14. 河岸冲刷和泥沙淤积的监测国内外研究现状

  15. 十二层带中心支撑钢结构...

  16. 中考体育项目与体育教学合理结合的研究

  17. 大众媒体对公共政策制定的影响




