6.1 可行性分析 24
6.2 系统的总体设计结构 25
6.3 系统的具体实现流程 26
6.3.1 程序结构 26
6.3.2 Ajax 27
6.3.3 主界面index 28
6.3.4 程序运行演示 29
结 论 31
致 谢 33
参考文献 34
1 引言
蛋白质是生命的物质基础,蛋白质在细胞和生命体的生命活动中起着至关重要的作用,可以说,没有蛋白质就没有生命。随着人类基因组计划(Human Genome Project)的实施和人类基因组序列的完成,蛋白质已知序列的数量呈爆炸式增长,生命科学已经实质性地夸人到后基因组时代。与此同时,已知序列蛋白质和已知属性蛋白质之间的数量差距也在逐渐拉大。这种不平衡的局面,已经 严重制约了我们及时利用新发现的蛋白质进行基础研究和药物开发[1]。由于湿实验(注:生物信息学中把与试管打交道的生物学实验称为湿实验,而把在计算机上做的实验为干实验。)试验周期长,复杂度高,因此,利用蛋白质仅有的信息序列,研究开发适当有效的计算方法,快速准确的预测未知蛋白质的属性,就变得非常重要。论文网
1.1 研究背景及意义
现代分子生物学研究表明,蛋白质是执行生物功能的大分子,在生命中起着极其重要的作用。蛋白质的功能是由其空间结构决定的。结构和功能的一致性促进了对蛋白质结构研究的巨大热忱,结构生物学的发展方兴未艾。虽然空间就够是由一级结构(即氨基酸的排列顺序)决定的这一原理,但是在一般情况下有一级结构预测其三级结构仍然是不现实的。与此同时,用X射线衍射和核磁共振技术测定蛋白质的结构取得了巨大的进展。迄今为止,已有近万种蛋白质的结构被测定,其中大部分属于同源蛋白质,非同源的仅有千余种。通过总结这些结构的共性和特性,对于阐明肽链的折叠规律是非常有益的。而其中对蛋白质结构的分类和预测不仅有着巨大的实用价值,而且对于探索肽链折叠的规律也有重要的理论价值。
蛋白质结构分类是在蛋白质的空间结构已知的前提下进行的,如果某蛋白质的空间结构未知,能否根据其一级结构来预测其结构类?这就是结构类预测。
蛋白质结构类的预测和分析有着非常重要的生物学意义。随着生物信息学源:自~751·论`文'网·www.751com.cn/
技术的高速发展,蛋白质序列数据库的数据积累的速度越来越快,与此同时,蛋白质结构类的预测远远落后于蛋白质序列的增长。尽管蛋白质结构类预测技术有了较为显著的进展,但是,通过实验方法确定蛋白质结构类的过程仍然非常复杂,代价较高。因此,研究开发一个高效的、准确率搞的融合多视角蛋白质序列特征的方法,替代简单序列串行的策略,就变得非常有必要。
1.2 国内外研究现状
1.3 本文的主要内容
从蛋白质序列预测蛋白质结构类是一个重要的任务,如何从序列中抽取有效的鉴别特征是关键步骤之一,由于单视角特征不能反应蛋白质的所有信息,因此融合多视角特征或是特高预测精度的有效途径。本文使用一种基于多视角融合技术的蛋白质结构类预测框架,在本文中,用到的新的蛋白质框架,多视角特征:首先,从不同的视角抽取特征,然后,将不同视角的特征并行组合,形成复特征,在复特征空间应用广义主分量分析,进行特征降维。在不同的数据集和算法上的实验结果表明,所实用的并行多视角特征融合策略是有效的。