随着人们认识程度不断提高与实际应用需要,普通集合理论不能完全解决模糊性的分类问题,例如:(1)将人按身高分为:“高个头、中等个头、矮个头”; (2)灾害性霜冻气候对农业产量影响程度为:“很严重、严重、较重、不严重”等类似这类问题分类没有一个明确界限。
模糊数学的产生为模糊分类提供理论基础,产生了模糊聚类分析理论[5]。传统的聚类分析以普通集合理论为基础来分类的,即将没类别标记的样本集按某种准则划为若干子集(类、群、簇),使相似样本点尽可能是一类,而不相似样本点尽可能归不同的类中;传统聚类是一种硬划分(Crisp Partition),它将每个待识辨对象严格划分到不同类中,具有“非此即彼”性质,因此,此类别划分界限是分明的。模糊聚类分析(Fuzzy Cluster Analysis)以模糊数学方法为基石来聚类,模糊聚类将模糊数学概念注入聚类分析中,来研究“物以类聚”这多元统计方法,是数值分类的分支,也是无监督模式识别的重要分支。
用模糊数学把样本间模糊关系定量确定,从而客观准确地来聚类。事实上,多数对象没严格的类属性和隶属关系,它们在属性等方面有重叠性、交叉性,有“亦此亦彼”性质,因此较适合模糊划分(Fuzzy Partition),也称软划分(Soft Partition)。模糊集合理论为这类模糊划分提供有力的分析工具,人类开始用模糊方法来处理聚类问题,称之为模糊聚类分析[6-9]。
在实际生活中,常遇到一些不能用数字准确描述的信息或者由于来自各渠道的信息缺乏完整性和不确定性(即模糊性),而传统的确定性信息处理的方法和理论对于这类信息的处理已不再完全适用。“所以处理这类信息时,需采用相应的模糊模型和方法,用数字定量地确定样品的“亲疏关系”,从而宏观地分型划类。而模糊聚类方法[11-13]指当涉及事物之间模糊界限时按一定要求对事物进行分类的数学方法”。因此,用模糊聚类分析法,能较好地处理这类问题,并且可以取得良好的效果。
1. 知识发现中的模糊聚类的基本理论
1.1 知识发现定义
知识发现(Knowledge Discovery in Database, KDD),是所谓"数据挖掘"的一种更广义的说法,即从各种媒体表示的信息中,根据不同的需求获得知识。知识发现的目的是向使用者屏蔽原始数据的繁琐细节,从原始数据中提炼出有意义的、简洁的知识,直接向使用者报告。知识发现是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。知识发现将信息变为知识,从数据矿山中找到蕴藏的知识金块,将为知识创新和知识经济的发展作出贡献。知识发现就是在大量的数据中提出有用的知识,知识发现过程如图1所示,由以下步骤组成:
(1)数据清理(消除噪音或不一致数据);
(2)数据集成(多种数据源可以组合在一起);
(3)数据选择(从数据库中提取与分析任务相关的数据);
(4)数据变换(数据变换成适合挖掘的形式;如通过汇总或聚集操作);
(5)数据挖掘(基本步骤,使用智能方法提取数据模式);
(6)模式评估(根据某种兴趣度度量,识别提供知识的真正有趣的模式);
(7)知识表示(使用可视化和知识表示技术,向用户提供挖掘的知识)。
图1知识发现过程步骤
1.2知识发现现状
知识发现是一门交叉学科,知识发现技术是目前国际上数据库、数据仓库和信息决策系统领域最前沿的研究方向之一,由于信息产业界存在可以广泛使用的大量数据,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括生产控制、工程设计和科学探索等。因此知识发现引起了国内外众多领域科学家和工商界的广泛关注。它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支持。在这种需求牵引下,汇聚了不同领域的研究者,尤其是数据库技术、人工智能技术、数理统计、可视化技术、并行计算等方面的学者和工程技术人员,投身到知识发现这一新兴的研究领域,形成新的技术热点。随着数据库、人工智能、数理统计及计算机软硬件技术的发展,知识发现技术必能在更多的领域内取得更广泛的应用。
- 上一篇:Lamb波板型结构中的宽频导波检测方法
- 下一篇:AT89S51单片机的音乐彩灯控制器设计+仿真图+源代码
-
-
-
-
-
-
-
当代大学生慈善意识研究+文献综述
河岸冲刷和泥沙淤积的监测国内外研究现状
电站锅炉暖风器设计任务书
十二层带中心支撑钢结构...
杂拟谷盗体内共生菌沃尔...
中考体育项目与体育教学合理结合的研究
酸性水汽提装置总汽提塔设计+CAD图纸
大众媒体对公共政策制定的影响
乳业同业并购式全产业链...
java+mysql车辆管理系统的设计+源代码