基于粗糙集理论的知识发现过程一般包括数据采集、预处理、数据约减、决策规则生成、分类、预测等步骤,如图1.1[3]所示
图1.1 粗集知识发现模型
数据采集将原始数据转换成RS可以理解的信息系统和决策表的形式,这依赖于原始数据的存储格式。
数据预处理对不完整的数据作必要的补充,同时对连续信号进行离散化。
数据约减是最关键的步骤之一,是RS理论用于数据分析的精髓。
规则生成是根据属性和属性值的约减结果,产生相应的决策规则。由于不一致决策表存在,可能导致规则的不一致性,通常给每条规则赋予一个信任测度或平率测度。
决策分类是对未知对象的分类过程。由于新对象来源于训练集之外,所以可能出此案规则集合未曾考虑的情况,在这种情况下,选择一条最接近的规则进行分类。
1.1.2多源信息
在现实生活中,人类及自然界中其他生物对客观事物的认识过程并不是单纯依靠一种感官进行,而是综合视觉、听觉、触觉、嗅觉和觉等多种器官获取多方面的信息,然后经由大脑对这些感知信息依据某种未知的规则进行组合和处理,从而得到对客观对象统一的理解和认识。这种由感知到认知的过程就是生物体的多源信息融合过程。
多源信息融合又称多传感信息融合,是20世纪70年代被提出来的[4]。现今人们所研究的多源信息融合,实际上是对人脑综合处理复杂问题的一种功能模拟。由于多源信息可能会具有不同的特性:时变的或非时变的,实时的或非实时的,确定的或不确定的,精确的或模糊的,互斥的或互补的等等,因此研究多源信息融合时最关键的问题就是提出一些理论和方法,对具有相似或不同特征模式的多源信息进行处理,以获得具有相关或集成特性的融合信息。
在信息融合研究和发展的近20年中,出现了很多解决信息融合的理论和方法,如大家熟知的模糊理论、随机理论、粗糙集集理论、神经网络、证据推理(DST)、自动推理(Automated Reasoning)、加权平均、贝叶斯估计等等,这些都是一些行之有效的方法。
近年来,美国新墨西哥大学的F. Smarandache教授在模糊、粗糙集等理论基础上,结合中智哲学思想提出来的中智理论[5]和法国学者J.Dezert与F. Smarandache从概率论和DST(证据推理)的基础上发展的DSmT(概率论和DST的一种广义化)方法[6],为不完善信息的广义融合开辟了新的思想和奠定了理论基础。相对于偏重对不完善信息不确定性刻画的概率论和模糊集来说,粗糙集更擅长于对信息的不完全性描述,以致它成为目前国内外专家研究的热点。
1.2本文研究内容
粗糙集理论(RoughSet)作为智能信息处理技术的一个新成果,是由波兰科学家Pawlak教授所提出的对不完整数据进行分析、推理、学习、发现的新方法[7、8]。目前RS理论已成为人工智能领域中一个较新的学术热点,引起越来越多科研人员的关注,并在许多科学领域和工程领域得到成功应用。
本文首先研究了粗糙集的基础理论知识,讨论了粗糙集的产生背景、定义及粗糙集中有关知识分类、知识约简等内容;其次探讨了决策表约简中的四种属性约简算法和四种属性值约简算法。现今,大部分决策问题都可以通过决策表形式地表达出来,因此它在工程应用中越来越重要。
在上述理论研究的基础上,本文以铁路列车运行调整为背景,对粗糙集理论中的知识约简算法及规则提取进行了实际的应用。本文通过对行调人员运行调整和决策的详细分析,构建了列车运行调整的粗糙集模型,提出了基于粗糙集的列车运行调整系统知识的获取与表达的方法,并通过对DMIS系统中部分列车运行数据的挖掘,证明了粗糙集理论在决策规则提取中的可用性和知识约简算法的实用性。最后对其他用于解决列车运行调整的方法和粗糙集的方法进行了对比分析。全文旨在说明粗糙集在决策简化过程中的实际应用意义。 基于粗糙集理论的多源信息决策知识约简研究(3):http://www.751com.cn/guanli/lunwen_7823.html