3决策表的约简
3.1知识的约简
知识约简[15]是粗糙集理论的核心内容之一。众所周知,知识库中知识并不是同等重要的,甚至其中某些知识是冗余的。所谓知识约简,就是在保持知识库分类能力不变的条件下,删除其中不相关或不重要的知识[16]。
3.1.1一般性的约简
在粗糙集理论应用中,约简和核是两个最重要的基本概念,也是粗糙集理论的精华。去除核中的任何一个属性,数据表的分类能力都将改变。因此,要保证数据表的分类能力不变,就必须保留核中的每个属性。约简是保持数据表分类能力不变的最小属性集,即它确定的对论域的划分与整个属性集合确定的划分一致,但去掉其中的任何一个属性,划分都将改变[2]。
定义2.11 [13]设R是等价关系的族集,P∈R,如果IND(R)=IND(R-P),则称P在R中是可以约去的知识,否则就是不可约去的知识。若R中的每个关系P都是不可约去的,则称族集R是独立的,否则就是依赖的或非独立的。
不必要关系的约简是不会改变知识库的分类能力,因此,它是多余的,可以将它从知识库中去除掉。那如果删掉一个必要的关系,则将会不同程度地削弱知识库的分类能力。
定义2.12 [13]若P ⊆R是独立的,并且IND(P)=IND( R),即由P决定的划分同由R决定的划分是一致,则称Q是关系族集P的一个约简。在族集P中所有不可省的关系的集合称为P的核,以CORE(P)来表示。
显然,约简并不是唯一的。下面的定理是建立核与约简之间联系的重要性质。
定理2.1[13]族集P的核等于P的所有约简的交集。即:CORE(P)=∩RED(P),其中RED(P)是P的所有约简的族集。
从定理中我们可以看出,核的概念具有两方面意义:首先,它可作为计算所有约简的基础,因为核包含于每一个约简之中,并且其计算式是直接的。其次,核可以解释为知识最重要部分的集合,进行知识约简时不能删除它。
3.1.2相对性的约简
定义2.13[12] 设R和Q是全域U上等价关系的族集,所谓族集Q的R-正区域,记作POSR(Q),定义为: 。
族集Q的R-正区域是全域U中所有那些使用U/R所表达的知识,能够正确地分类在U/Q的等价类中的对象集合。从上面的定义我们知道,集合X相对于一个等价关系R的正区域就是这个集合的下近似R*(X);而一个等价关系Q相对于另一个等价关系R的正区域就是隶属于U/Q等价类中的集合的下近似的并。
定义2.14 [12]设R和Q是全域U上的等价关系的族集,P∈R。若:
则称关系P在族集R中是Q-可省的,否则称为Q-不可省的;如果在族集R中的每个关系P都是Q-不可省的,则称R关于Q是独立的,否则就称为是依赖的。
定义2.15[12] S⊆R称为R的Q-约简,当且仅当S是R的Q-独立的子族集,且POSS(Q)= POSR(Q); 族集R中的所有Q-不可省的初等关系的集合,称为族集R的Q-核,记作COREQ(R)
容易看出,当R=Q时,上述定义就是一般约简中所提及的定义。
下面的定理是定理2.1的推广:
定理2.2[12] 族集R的Q-核等于R的所有Q-约简的交集,即:COREQ(R)=∩REDQ(R)。其中REDQ(R)是族集P的作于Q-约简的族集。
3.1.3知识的依赖性
依赖性也是粗糙集中的一个重要概念,可以通过依赖度比较等价关系之间的依赖程度,进而判断其等价关系的重要程度,就可以根据这个标准,对冗余的等价关系进行删减[16]。
定义2.16[16] 令K=(U,R),P、Q⊆R,
(1)Q依赖于P,当且仅当IND(P)⊆IND(Q),记作P⟹Q;
(2)P和Q是等价的,当且仅当P⟹Q且Q⟹P,即IND(P)=IND(Q),记作P=Q;
(3)P和Q是独立的,当且仅当P⟹Q且Q⟹P均不成立的时候,记作P≠Q;
- 上一篇:歌帝梵巧克力行业消费者行为分析
- 下一篇:LGD方法在大学生招聘中的应用研究
-
-
-
-
-
-
-
当代大学生慈善意识研究+文献综述
酸性水汽提装置总汽提塔设计+CAD图纸
十二层带中心支撑钢结构...
杂拟谷盗体内共生菌沃尔...
电站锅炉暖风器设计任务书
java+mysql车辆管理系统的设计+源代码
大众媒体对公共政策制定的影响
乳业同业并购式全产业链...
河岸冲刷和泥沙淤积的监测国内外研究现状
中考体育项目与体育教学合理结合的研究