具体来表述,整个挖掘过程包含下面几个步骤(如图2.1所示):
图2.1 数据挖掘过程的步骤
1)数据集成:保证数据一定要大量且全面丰富,只有这样才能更具有说服性。数据过于少,整个数据挖掘过程肯定毫无作用。
2)数据过滤:数据过滤是对整个数据集合就行清洗,消除噪声和一些格式等不一样的数据,避免其对挖掘结果产生影响。通过这一步骤,可以得到更加准确、更加丰富的数据,从而保障挖掘过程的顺利进行。
3)数据选择:在数据库中提取符合要求的相关数据
4)数据转换:将一些形式不符合的数据进行相应的转换得到符合要求的数据
5)数据挖掘:使用适当的数据挖掘方法进行挖掘
6)评估:判断数据挖掘结果是否合理,是否有实际意义。评估也可以依据丰富的经验,用数据来验证模型是否正确,进而调整整个模型,再反复进行挖掘。
7)结果表示:把数据之间的特性、数据之间的关系形象具体化的描述。
2.2.3 数据挖掘的分类
数据挖掘有多种分类方式,可以根据发现的知识类型、采用的技术类型、数据库的类型、挖掘的深度以及挖掘的应用领域来进行分类。
这里主要介绍一下按照被发现知识类型分类:
1) 关联规则挖掘:数据挖掘中最先研究的挖掘方法之一。在实践中也比较成熟,挖掘目的也从最初的发现项集之间的关联关系扩展为不同类型的关联关系。
2) 特征规则挖掘:从相关的一组数据之中提取表达式,用这些表达式去描述整个数据集合的特征。
3) 分类规则挖掘:通过分析数据的样本,得出有关类别的较为准确的描述。
4) 时序规则挖掘:也称为序列模式,是生成与时间有关的规则。
5) 偏差规则挖掘:偏差包括分类中的反常实例、例外模式、观测结果对期望值的偏离及量值随时间的变化等。
按挖掘数据库类型分类分为面对对象、事务数据库及多媒体数据库等等,其余几种分类标准也有相对应的分类,就不一一列出。
- 上一篇:FPGA数字视频信息叠加软件设计+源程序
- 下一篇:数据挖掘国内外研究现状
-
-
-
-
-
-
-
电站锅炉暖风器设计任务书
当代大学生慈善意识研究+文献综述
河岸冲刷和泥沙淤积的监测国内外研究现状
大众媒体对公共政策制定的影响
杂拟谷盗体内共生菌沃尔...
十二层带中心支撑钢结构...
乳业同业并购式全产业链...
java+mysql车辆管理系统的设计+源代码
中考体育项目与体育教学合理结合的研究
酸性水汽提装置总汽提塔设计+CAD图纸