摘要正确预测蛋白质绑定残基在生物学中具有非常重要的意义,特别是在科研工作和医理药物设计方面。但是蛋白质-配体绑定位点在生物信息学中却极少涉及到,这是因为蛋白质绑定残基在蛋白质序列里占很少一部分,不利于信息的采集。根据机器学习的非平衡学习环境,并基于支持向量机理论和蛋白质特征提取方法,本文设计的系统对蛋白质序列进行信息比对,特征提取,实现了辨别蛋白质绑定残基和非绑定残基的预测过程。这个系统即TargetATPsite在J2EE环境下实现,为用户提供在线预测服务和结果下载功能。61644
毕业论文关键词 蛋白质绑定残基预测 具体位置得分矩阵 支持向量机
毕业设计说明书(论文)外文摘要
Title A design and implementation of protein-ATP binding residues prediction system
Abstract Correctly locating the protein-ATP binding residues has very important significance in the field of biology, especially for scientific research and medical drug design. However, it is rarely involved in bioinformatics for the fact that the protein-ATP binding residues account for a small percentage of the chain of proteins. On the basis of the machine learning theory, as well as the Support Vector Machines (SVM) theory and protein feature extraction method, we design a system to implement the prediction by information comparison and feature extraction. The system, called TargetATPsite, has been implemented with J2EE programming method, while online prediction and result download are available for all users.
Keywords Protein-ATP binding residues prediction Support Vector Machines Position specific scoring matrix
目 次
1 引言 5
1.1 研究背景和意义 5
1.2 本文的主要工作 6
1.3 论文结构 6
2 TARGETATPSITE预测系统基础知识 6
2.1 PSSM矩阵 6
2.2 ADABOOST算法 7
2.3 支持向量机 7
2.4 K倍交叉验证 9
2.5 预测系统门阀值 9
3 TARGETATPSITE预测系统实现过程 9
3.1 构建可使用的PSSM 10
3.2 构建最终的数据结果 11
4 TARGETATPSITE预测系统实验过程 11
4.1 PSI-BLAST实验过程 12
4.2 LIBSVM实验过程(在JAVA虚拟机中调用) 16
5 TARGETATPSITE预测系统设计与使用 19
5.1 系统设计 19
5.2 模块设计 22
5.3 流程设计 23
5.4 功能设计 24
6 TARGETATPSITE预测系统可存在的改进方向 27
6.1 蛋白质二级结构 27
6.2 其他信息改进 28
结论 29
致 谢 30
参考文献 31
1 引言
1.1 研究背景和意义