变精度粗糙集的案例约简方法研(3)

现实生活中有许多含糊现象并不能简单地用真、假值来表示，如何表示和处理这些现象就成为一个研究领域。早在1904年谓词逻辑的创始人G.Frege就提出了含糊(Vague)一词，他把它归结到边界线上，也就是说在全域上存在一些个体既不能在其某个子集上分类，也不能在该子集的补集上分类。粗糙集理论是由波兰科学院Z.Pawlak院士于1982年在文[1]中首先提出的，其视论域的划分为知识并进行刻画及研究规则提取、知识约简等，是一种新的数据分析与推理的数学理论。粗糙集理论提供了案例约简的一种数学方法。由于这一理论的广泛应用，它越来越引起国际学术界的关注。

目前，粗糙集理论在信息科学、医药科学、工程技术、金融商业、环境科学、社会科学等领域中得到了广泛的、较为成功的应用，并且越来越受到其它更多领域的重视。基于这样的背景下，本文旨在通过对粗糙集理论的认识和研究，为决策过程的简化提供工具和方法，并证明粗糙集在实际生活中的适用性。

1.1.1粗糙集理论研究现状

1.1.2 粗糙集理论在案例检索中的应用

随着社会的发展，现代知识结构变得越来越复杂，所包含的属性越来越多，尤其是大型机械设备所实现的功能越来越强大，包含的部件越来越多，这些都使得作为知识表达的案例表示越来越复杂，包含的属性越来越多。属性的增多无疑增加了计算机处理系统的处理难度，尤其是当案例库中案例变得很庞大时，案例推理(CBR)[26]中检索的速度将受到极大的影响，而案例库中案例的丰富与否又直接影响着案例检索的结果，因此维护一定数量的案例集是案例推理系统中所必须的。因此如何从高维数据中剔除其中冗余的、不重要的属性，即如何简化知识系统就成为解决该难题的一个方向。

粗糙集理论不仅为信息科学提供了新的研究理论，也为智能信息处理提供了有效的解决办法。从粗糙集理论的核心内容之一——属性约简——可以保持决策系统分类能力不变的情况下，删除其中不相关或者不重要的属性列，从而简化案例库中属性的维度，简化案例集的知识表示，提高计算机对案例集的处理能力；同时属性约简可以从案例库中提取一些关键属性信息，获得一些重要的规则知识，可以用于机器学习和数据挖掘领域。简单来讲，粗糙集理论的主要特点如下：

(1)粗糙集理论仅利用数据本身提供的信息，无须任何先验知识。

(2)粗糙集理论是一个强大的数据分析工具。它能表达和处理不完备信息；能在保留关键信息的前提下对数据进行约简并求得知识的最小表达；能识别并评估数据之间的依赖关系，揭示出概念简单的模式；能从经验数据中获取易于证实的规则知识。

1.2 本文主要研究内容

粗糙集理论(Rough Set Theory，简称RST)是一种新型的处理不确定性知识的工具，它的最大特点是只需要提供所需处理的数据集合，不需要任何其他先验知识。是由波兰科学家Pawlak教授所提出的对不完整数据进行分析、推理、学习、发现的新方法[2]。目前RS理论已成为人工智能领域中一个较新的学术热点，引起越来越多科研人员的关注，并在许多科学领域和工程领域得到成功应用。

本文首先研究了粗糙集的基础理论知识，讨论了粗糙集的产生背景、定义及粗糙集中有关知识分类、信息系统定义、属性约简等内容；其次探讨了变精度粗糙集模型，决策表约简中的四种属性约简算法和四种属性值约简算法。现今，大部分决策问题都可以通过决策表形式地表达出来，因此它在工程应用中越来越重要。变精度粗糙集的案例约简方法研(3):http://www.751com.cn/guanli/lunwen_70291.html