图1.1给出了本文的总体研究框架:
图1.1 本文总体研究框架
2粗糙集理论的基本概念
2.1粗糙集理论提出的背景
经典逻辑中只有真、假二值,但实际上有大量含糊现象存在于真和假二值之间。因此,长期以来许多逻辑学家和哲学家就致力于研究含糊概念。早在1904年,谓词逻辑的创始人G.Frege就提出了含糊(Vague)一词,并把它归结到边界线区域,也就是说在全域上存在一些个体既不能在其个子集上被分类,也不能在该子集的补集上被分类。20世纪60年代初,L.A.Zadeh提出了模糊集,不少理论计算机科学家和逻辑学家,试图通过这一理论解决G.Frege的含糊概念,但遗憾的是,模糊集是不可以计算的,没有给出数学公式描述这一含糊概念,故无法计算它的边界线上的具体的含糊元素数目。时隔20年后的80年代,Z.Pawlak针对G.frege的边界线区域思想提出了Rough集[5],他把那些无法确认的个体都归属于边界线区域,而这种边界线区域被定义为上近似集和下近似集之差集。由于上近似集和下近似集都可以通过等价关系给出确定的数学公式描述,所以含糊元素数目可以被计算出来,即在真假二值之间的含糊程度可以计算,从而实现了G.Frege的边界线思想。根据Pawlak做出的定义,粗糙集(Rougn Set,RS)理论是一种刻划不完整性和不确定性的数学工具,能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律[9]。目前,粗糙集已成为一门研究和处理含糊和不精确性问题的学科[10]。
2.2集合间的等价关系
关系的某些特殊性质是指自反性、对称性和对称性[11]。
定义2.1 设R是集合A到A的二元关系,如果对任意a∈A有(a,a)∈R,则称R是A上的自反关系。
定义2.2 设R是集合A上的二元关系,如果对任意a、b∈A,有(a,b)∈R,也必有(b,a)∈R ,则称R是A上的对称关系。
定义2.3 设R是集合A上的二元关系,对任意a、b、c∈A,如果无论什么时候有(a,b)和(b,c)∈R,也必有(a,c)∈R,则称R是A上的传递关系
定义2.4 设R是集合A上的二元关系,如果它是自反、对称、传递的,则它是A上的等价关系。
定义2.5 设R是A上的一个等价关系,与A中的一个元素a相关的所有元素的集合被称作a的一个等价类,记成[a]R。当仅考虑一个关系时,我们略去下标,而简写成[a]。形式地,[a]R={s∣(a,s)∈R}
2.3知识的分类观点
基本粗糙集理论认为知识是人类和其他物种所固有的分类能力。因此,粗糙集理论假定知识是一种对对象进行分类的能力。这里的“对象”是指我们所能言及的任何事物,比如实物、状态、抽象概念等等。即知识必须与具体或抽象世界的特定部分相关的各种分类模式联系在一起,这种特定部分称为所讨论的全域或论域(universe)[12]。事实上,知识构成了某一感兴趣领域中各种分类模式的一个族集(family),这个族集提供关于现实的显事实,以及能够从这些事实中推导出隐事实的推理能力。
粗糙集理论建立在分类机制的基础之上,它将分类理解为在特定空间上的等价关系,而等价关系构成了对该空间的划分。粗糙集理论将知识理解为对数据划分的结果,每一被划分的集合称为概念。
定义2.6[12] 一个近似空间(或知识库)定义为一个关系系统(或二元组)K=(U,R)其中U≠ø是一个被称为全域或论域(universe)的所有要讨论的个体集合,R是U上等价关系的一个集合。
定义2.7[12]设P⊆R且P≠ø,P中所有等价关系的交集称为P上的一种不可分辨关系,记作IND(P),即 。在这里注意:IND(P)也是等价关系且是唯一的。 基于粗糙集理论的多源信息决策知识约简研究(4):http://www.751com.cn/guanli/lunwen_7823.html