融、电力、医疗等众多领域商业应用的深入发展(Friedman, J.H,1997)。
数据挖掘主要用于指定数据挖掘任务中要找的模式类型,其任务主要可以分为描述和
预测两大类。描述性挖掘任务是指描述数据库中数据的一般特性,而预测性挖掘任务是在
当前数据基础上对未来进行推测判断,用于预测。数据的挖掘的功能主要包括以下几个方 面:
(1)概念描述
概念描述就是将与对象相关联的数据进行汇总、分析和比较,并对该类对象的内涵进
行描述,概括其相关特征。比如说,数据库中的一张表格代表一个对象集,这张表中的每
条记录可以看作是一个对象,每个对象都有其唯一的标识和多个属性值。然后一个或多个
属性上取值相同的对象便构成了一个对象类。
(2)特征规则
特征规则挖掘是将全部数据所满足的概念特征化。特征规则挖掘主要是总结指定数据
集的一般特征,并且从与学习任务相关的一级数据中提取出特征式。例如,可以从某种动
物的生活习性中提取出该种动物的特征规则。
(3)分类
在数据挖掘的各种方法中,分类是最有效的数据分析方法之一。分类是把数据库中的
数据,转化成一种给定的类别,从而将其应用于预测分析。分类问题的研究已经被广泛应
用于邮件分类、地形勘察、银行贷款信用评估等领域。目前得到广泛研究的分类模型有决
策树、神经网络、粗糙集、统计方法、贝叶斯分类等。本文主要研究的就是基于朴素贝叶
斯算法的预测问题,基于朴素贝叶斯算法的预测模型正确率和效率上都有着显著的优势。
(4)预测分析
预测是构造并使用模型估计未知或给定样本类所可能具有的可能性。预测主要指根据
预测模型和已知数据属性,对待测样本的待定属性值进行预测。分类与回归是预测的两大
主要研究对象,其中分类是预测离散或标称值,而回归是用于预测连续或有序值。
朴素贝叶斯分类器发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。
同时,朴素贝叶斯模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。理
论上,朴素贝叶斯模型与其他分类方法相比具有最小的误差率。故朴素贝叶斯算法将是本
文的研究重点。
(三)研究过程
1、设计过程
本研究的主要内容在于算法的设计与验证。整体设计思路与内容描述如下:
(1)搜集信息
将笔者在部队服役期间通过耳濡目染以及从相关公开的文件中统计到的数据进行收
集汇总。然后对这这些信息进行分类并跟据研究需要加以整合,进而得到本研究所需要的
相关数据;
(2)数据模拟
由于本研究所牵扯到的问题与军队相关,政治敏感性很强,相关数据若是直接在正式
场合进行公开使用难免会引起不必要的麻烦。故为了安全起见,在实验过程中需要对搜集
到的真数据进行模拟设计。然后对数据的相关属性进行必要的分类;
- 上一篇:Android儿童识数训练应用开发
- 下一篇:ASP商业银行网上信贷自助服务系统的功能设计与实现
-
-
-
-
-
-
-
中考体育项目与体育教学合理结合的研究
电站锅炉暖风器设计任务书
河岸冲刷和泥沙淤积的监测国内外研究现状
当代大学生慈善意识研究+文献综述
酸性水汽提装置总汽提塔设计+CAD图纸
大众媒体对公共政策制定的影响
乳业同业并购式全产业链...
十二层带中心支撑钢结构...
java+mysql车辆管理系统的设计+源代码
杂拟谷盗体内共生菌沃尔...