摘要生物信息学是一门新兴的交叉科学。它所研究的是生物学的数据,而它进行研究所采用的方法,则是从各个计算技术衍生过来的。随着人类基因组计划和一些模式生物基因组计划的完成,公共数据库中生物数据的增长速度越来越快。如何从海量的生物数据中解读、提取和获得有用的生物信息,已成为基因组计划下一步亟待解决的问题。本文首先介绍了生物学中的研究对象,有关于核酸、蛋白质的基础知识也有详细阐述。主要研究内容有以下两个部分:
在第二章中,首先介绍了数学建模的基本步骤以及相关知识;然后又介绍了数学模型与生物信息学的交叉,对于数学建模在生物学中的方法应用也有举例。
在第三章中,我们介绍了一种利用密码子以及其同义密码子出现频率比较的方法,并在此基础上给出了一种提取3元向量来描述和刻画DNA序列的模型。我们方法的优点是既不需要图形表示和进行高阶矩阵的不变量计算,也不需要进行多重序列比对。对于7个不同β球蛋白基因的第一个外显子编码序列间的相似性分析表明我们的方法是可行的。21033
毕业论文关键词:生物序列;数学建模;生物信息学
Abstract
Bioinformatics is a new inter discipline. It is the study of the biological data, and its research methods, from various computing technology is derived. With the Human Genome Project and some model organism genome project, the biological data in the public database is growing faster. How from the massive biological data interpretation, extraction and obtain the useful biological information, has become a urgent problem to be solved genome plan the next step. This paper firstly introduces the object of study in biology, have basic knowledge about nucleic acid, protein and in detail. The main research contents of the following two parts:
In the second chapter, we first introduce the basic steps of mathematical modeling and the related knowledge; and then introduced the cross model and bioinformatics, the application method of mathematical modeling in biology have for example.
In the third chapter, we introduce the method of frequency comparison using a codon and the synonymous codon, which is on the basis of a 3 element vector extracted to describe and characterize DNA sequences model. The advantages of our method is neither need graphic representation and invariant calculation of high order matrix, do not need to perform multiple sequence alignment. For the 7different beta globin gene of the first explicit similarity between sub band coding sequence analysis shows that our method is feasible.
Key words:Biological sequence; mathematical modeling;Bioinformatics
目 录
1 绪 论 1
1.1生物信息学的产生背景 1
1.2生物信息学的研究对象 1
1.2.1核酸 2
1.2.2 蛋白质 4
1.2.3 中心法则 6
1.3 生物信息学的主要研究领域 9
1.3.1 序列比较 9
1.3.2 遗传密码的起源 10
1.3.3 基因识别 10
1.4 本文的主要工作 11
2 数学建模 12
2.1数学建模的概念 12
2.2数学模型的分类 12
2.3数学建模的一般方法 12
2.4模型建立的步骤 13
2.5 数学模型与生物信息学的交叉 14
3 DNA 序列数学模型的建立以及相似性分析 16
3.1 实验数据 16
3.2 DNA 序列的数值刻画及模型建立 17
3.3 DNA 序列的相似性分析 19
3.4 小结 20 数学模型在生物信息学中的应用:http://www.751com.cn/shuxue/lunwen_13055.html