毕业论文论文范文课程设计实践报告法律论文英语论文教学论文医学论文农学论文艺术论文行政论文管理论文计算机安全
您现在的位置: 毕业论文 >> 计算机论文 >> 正文

数据库中敏感关联规则隐藏算法研究数据挖掘+流程图 第3页

更新时间:2016-8-28:  来源:毕业论文
关联规则隐藏算法分类
根据关联规则隐藏算法所处理的数据集,关联规则隐藏算法可以分为基于分布式数据集的隐藏算法和基于集中式数据集的隐藏算法。
2.2.1基于分布式数据集的关联规则隐藏算法
基于分布式数据集的关联规则隐藏算法又可分为基于水平数据集的隐藏算法和基于垂直数据集的隐藏算法,要解决的关键问题是如何安全地从分布式数据集上得到规则的支持度和置信度,从隐私保持技术上来分基于分布式数据集的隐私保护算法属于安全多方技术范畴,隐私保护的思路是保证各个站点只能知道本站点自身的频繁项集而无法获知其他站点的频繁项集。
(1)基于垂直数据集的隐藏算法
垂直分布是指数据按照属性分布在各个站点,在这种条件下,可以通过发现项集的支持计数来进行数据挖掘。如果某个项集的支持计数可以被安全地计算,那么通过检查计数和预先设定的阈值比较,就可以知道该项集是否是频繁项集。Jaideep Vaidya通过安全地计算代表子项集的标量积的方法来得到项集的支持计数。在这里,将目标数据库视作是由固定长度的0、l序列构成的,同时考虑的是数据垂直分布在两个站点上的情况。但是,如果按照上面的方法,要计算支持计数,那么站点A或B都必须公布各自的私有信息,暴露了自己的隐私。流程图如下:

图1 基于垂直数据集的隐藏算法流程图
(2) 基于水平数据集的隐藏算法
水平分布是指数据按照记录分布在各个站点,在此条件下,各个站点不必知道其他站点的具体记录信息,就可以计算出全局的关联规则。Murat在文[5]中提出了一种数据水平分布下的针对关联规则的隐私保护数据挖掘算法。算法通过两个步骤找出全局频繁项集:
第一步使用交换加密的方法发现候选集。各个站点加密各自的频繁项集,然后将结果传递到下一个站点。传递的同时去掉重复的集合,整个过程一直持续到所有的站点加密完所有的项集,然后各个站点使用自己的密钥对得到的结果进行解密,最后得到一个公共的项集。
第二步找出满足条件的全局频繁集。首先第一个站点计算由第一步得到的项集在本地的支持度与最小支持度阈值之间的差,然后加上一个随机数R,将结果传给下一个站点;第二个站点做与第一个站点相同的工作,同时加上第一个站点传来的值,接着将结果传递至下一个站点;依次直至传递完所有站点,最后的值记为A传递回第一个站点。最后在第一个站点将结果与R比较,如果该值不小于R,则说明该项集为全局频繁项集。流程图如下:

上一页  [1] [2] [3] [4] [5] 下一页

数据库中敏感关联规则隐藏算法研究数据挖掘+流程图 第3页下载如图片无法显示或论文不完整,请联系qq752018766
设为首页 | 联系站长 | 友情链接 | 网站地图 |

copyright©751com.cn 辣文论文网 严禁转载
如果本毕业论文网损害了您的利益或者侵犯了您的权利,请及时联系,我们一定会及时改正。