社交网络中的隐私保护主要指的是社交网络中与用户紧密关联的数据尤其是私密数据的保护。要达到保护数据的目的,最传统的做法是通过各种加密算法对数据进行加密,能保证数据完整性的同时能防止数据泄漏。但是研究社交网络的目的是为了研究社交网络的某些指标如聚集系数等,通过这些指标进一步分析社交网络的特征和属性,这些反映社交网络特性的指标其实就是社交网络数据的效用,现有的一些隐私保护方案并没有研究对社交网络效用的影响。这些方案虽然能使得用户数据得到有效保护,但是社交网络数据的效用却大打折扣,也严重影响了这些社交网络数据在研究分析中的应用价值。因此,如何在保护有关用户隐私的社交网络数据的前提下,同时兼顾到社交网络数据的效用将会成为今后业界研究的热点问题。
1.2 研究意义
社交网络给用户提供了一个在线发布如文字、图片等信息的交流平台,其他用户可以对这些信息进行转发、评论或者点赞等,然而不同的社交平台网络的特性却不尽相同。例如,Facebook,每个上线的用户都拥有一个可以标明自己身份的“用户资料”,该用户可以凭借“用户资料”这个凭证和其他用户在线交流。在这个基础上,又衍生出成为了几种性质不同的社交网络,例如,一些带有竞争性质的社交网站。这些具有竞争性质的社交网站中,起决定性作用的是用户的个人信息,用户之间的关系则不占主导作用。此时,一些具有价值的用户信息就很有可能被非法窃取、盗用,甚至被非法使用。而社交网站的用户为了便于与其他用户分享交流信息,也更愿意把自身的真实信息公开于众,因此,如果不对这些公开的用户信息加以防范,那么这些用户的社交网络数据信息将面临极大的安全风险。攻击者可以通过各种渠道获得的数据来观察用户与其他用户之间的相互关系,进而在相互“信任”的用户中间非法传播未经许可的或者具有欺骗性的虚假信息。对于攻击者来说,目前社交网络中用户隐私数据的价值主要体现在以下几个方面:
(1)对于Email、QQ等信息交流工具来说,这些都是网络宣传的重要工具,出售这类信息可以获取利益。
(2)对于微博等社交平台来说,可以获取用户的浏览痕迹,其中包括浏览喜好、浏览时间或其他与用户浏览习惯有关的信息,可以根据这些信息分析出用户特征,然后针对不同类型的用户进行不同种类的营销。
(3)利用获取到的信息进一步破译用户的登录账号、密码等具有重要价值的隐私信息,进一步侵入用户的网银等具有金钱信息的账户。
近些年来,社交网络中针对隐私信息的攻击事件屡有发生。2011年,人人网用户收到一封相同的站内信,若用户打开这个站内信则该用户的ID、生日、学校等用户隐私信息将会泄露。种种事实表明,当今互联网形势下社交网站的信息安全正在面临的严重的安全威胁,开展针对社交网络中保护用户隐私方面的研究具有重大而现实的意义。
2.国内外研究现状
在社交网络中,一个节点代表一个用户。需要对网络的一个节点进行一定程度的匿名。其中,关于隐私防护层面,人为干扰和泛化是最常用的匿名手段。其中,韦伟、李杨等学者[1]提出了一种基于GSNPP的社交网络隐私保护方法,源^自#751L文W论/文]网[www.751com.cn,这种方法对之前社交网络中的节点进行聚类操作,进而生成多个簇,然后再在簇间和簇内进行泛化,这样就实现了用户匿名化处理,同时平衡了结构信息量的损失和原有属性信息。