1.4 论文结构安排
本文主要是从蛋白质序列出发,对蛋白质结构类的预测。通过学习国内外相关研究成果,设计了基于多视角特征融合的蛋白质结构类预测系统。
第一章为引言部分,内容包括课题的研究背景及意义,国内外研究现状及研究的主要内容。
第二章是对蛋白质结构类预测概述,先介绍了蛋白及蛋白质的结构分类等信息,然后讲述了蛋白质结构类预测。
第三章介绍了相关数据集和特征提取,其中包括基准数据集的介绍和PseAAC和PsePSSM相关知识。
第四章对相关方法进行概述,包括并联组合,广义的主成分分析及预测框架和空间预测模型。
第五、六章介绍了COMSPA 软件的相关内容,包括程序的设计、环境配置及使用。文献综述
2 蛋白质结构类预测概述
蛋白质(protein)是生命的物质基础,没有蛋白质就没有生命。因此,它是与生命及与各种形式的生命活动紧密联系在一起的物质。机体中的每一个细胞和所有重要组成部分都有蛋白质参与。蛋白质的结构与蛋白质分子上的氨基酸序列信息有着直接的关系。
2.1 蛋白质概述
蛋白质是一种复杂的有机化合物,旧称“朊(ruǎn)”。氨基酸是组成蛋白质的基本单位,氨基酸通过脱水缩合连成肽链。蛋白质是由一条或多条多肽链组成的生物大分子,每一条多肽链有二十至数百个氨基酸残基(-R)不等;各种氨基酸残基按一定的顺序排列。蛋白质的氨基酸序列是由对应基因所编码。除了遗传密码所编码的20种基本氨基酸,在蛋白质中,某些氨基酸残基还可以被翻译后修饰而发生化学结构的变化,从而对蛋白质进行激活或调控。多个蛋白质可以一起,往往是通过结合在一起形成稳定的蛋白质复合物,折叠或螺旋构成一定的空间结构,从而发挥某一特定功能。合成多肽的细胞器是细胞质中糙面型内质网上的核糖体。蛋白质的不同在于其氨基酸的种类,数目,排列顺序和肽链空间结构的不同。