摘要:随着数据量的增大,数据挖掘技术应用不断扩大,如何保护私有信息或是敏感知识在数据挖掘中不被泄露,同时又能较为准确的得到数据挖掘的结果显得尤为重要。本文从对数据挖掘与隐私保护领域的隐私概念的论述,从数据分布、数据修改、数据挖掘算法、数据及规则的隐藏、隐私保持五个角度对隐私保护技术进行了阐述,并且对隐私保护技术中出现的不足提出了解决方法,还给出了隐私保护挖掘算法性能的评估方法。
关键词:数据挖掘;隐私保护;分布式数据
The Research of Privacy Protection Technology in Data Mining
Abstract:With the increasing of the data, The application of data mining technology continuously extension, it is very important that how to protect private information or sensitive knowledge are not to be leaked in data mining, and that people can accurately get the result of data mining at the same time. Based on the data mining and privacy protection in the field of privacy concept discussion, from the data distribution, data modification, data mining algorithms, data and rules, privacy preserving of five perspectives on privacy protection technology in detail, and on privacy protection technology where the shortage appeared in also put forward to the methods to solve, in addition, giving out privacy protection data mining algorithm performance evaluation method.
Key words: Data mining; Privacy protection; Distributed data
目录
摘 要 1
引言 2
1.课题概述 2
2.隐私保护技术 3
2.1 数据分布方式 3
2.2 数据修改方法 4
2.3 数据挖掘算法 4
2.4 数据与规则隐藏 4
2.5 隐私保持 4
2.5.1基于启发式的隐私保持技术 4
2.5.2 基于密码学的隐私保持技术 5
2.5.3 基于重构的隐私保持技术 5
3.隐私保护技术存在的不足及解决方法 6
4.隐私保护数据挖掘算法评估 6
4.1算法效率 6
4.2数据有用性 7
4.3隐私保护程度 7
5. 结束语 7
参考文献 8
致谢 9,4020
数据挖掘中的隐私保护技术研究
引言
我们处在一个信息爆炸的大时代,计算机处理能力、存储技术以及互联网络的发展又极大地提高了信息的数字化处理程度,现代计算机硬件及网络技术的发展,不仅使得海量的个人信息、交易记录等数据能够得以方便的存储和查询,同时也促进了数据挖掘技术的发展。
虽然,运用数据挖掘所得到的数据知识通常都代表了大部分数据记录的特性和整个数据集合的分布规律,但是具体的挖掘过程离不开对个体记录的逐一检索和计算。于是,现行挖掘算法对原始记录的依赖也就将原始数据直接暴露给了挖掘过程,任何参与者都能够接触到真实的数据,这也意着大部分的挖掘算法都存在着泄露隐私的可能。因此,为了保护数据中的敏感信息,我们需要一类能够保护隐私信息的挖掘方法,既能得到与传统算法等价的挖掘结果,又要使得用户的敏感数据不会泄露,难以被别有用心者获得,同时还要确保执行的效率。
1.课题概述
数据挖掘是用来对海量数据进行处理,从中抽取和发现感兴趣知识的有效手段,它可以使用户及时、准确地得到所需要的信息。数据挖掘将传统的数据分析方法与处理大量数据的复杂算法相结合,在大型数据存储库中,自动发现有用信息,探查大型数据库,发现未知有用模式,并且可对未来观测结果预测[1]。 数据挖掘中的隐私保护技术研究:http://www.751com.cn/jisuanji/lunwen_491.html