(3)即时通讯:随着越来越多的人开始使用微信,QQ等这些即时通讯软件,越来越多的钓鱼者瞄准这类社交工具来进行大面积诈骗。钓鱼者借助盗取的账号,对其好友,网友等及本人的社交圈进行传播。黑客利用人与账户拥有者之间的信任关系,模仿拥有者来向周围圈子行骗,成功率也随之大大提高。随着社交软件,网站的流行,钓鱼者也会利用网页漏洞进行蠕虫式传播,随着大面积传播,总会有消费者上当受骗,最终成功进行钓鱼攻击。
(4)线下传播:钓鱼者除了利用网络传播钓鱼攻击之外,也会利用手机短信,电话等其他线下方式进行钓鱼传播,扩大其潜在受害者范围。
借助以上传播方式,当用户受骗点击进入钓鱼网站后,钓鱼者会进一步利用多样的技术手段来完全迷惑用户,让其对网站信任,进而泄露隐私信息,一般而言钓鱼技术可分为以下几类:
(1)混淆URL
钓鱼网站的域名一般与官方网站的域名很相似,钓鱼者利用一些数字,字母和符号之间的相似性,比如,字母o和数字0,字母l和数字1之间很难区分;或者在主域名之前增加很多域名信息来迷惑用户。这样用户很容易相信钓鱼网站。
(2)跳转攻击
由于某些知名网站有提交参数过滤不严格的网页应用漏洞,钓鱼者构建出很容易迷惑用户的网址然后通过漏洞连接到知名网站的URL中进行跳转,然后弹出伪造的登录页面,用于盗取账号和密码,登录成功后就会转到支付页面,进而骗取银行账号和密码等信息。
(3)电话诈骗
电话诈骗主要针对于在线购买机票,火车票。这也是与线下诈骗向结合的一种比较新型的诈骗手段。在春运前后和旅游旺季期间,钓鱼者利用购票紧张为诱饵,在网站发布特价票等信息吸引用户浏览。在用户点击进入后,钓鱼者会以各种理由让用户电话联系钓鱼者,在线下进行诈骗。
(4)中奖交税
钓鱼者利用社交网络,即时通讯工具广泛传播虚假消息,采用经典的中奖交税的骗局,并且也涵盖了很多例如CCTV,的非常751加一,我要上春晚等节目,或者淘宝周年庆等知名品牌。
1.2 研究现状
2 基于特征组合的钓鱼网页检测
2.1 算法流程
为了能够提取网页的身份和特征向量,首先需要获得网页重要信息的标签和数据值。文件对象模型(DOM)[6]是一种与平台,浏览器和语言之间的接口,DOM树能有效化解不同编程语言之间的矛盾来提供一种标准的方法来访问站点中的数据和脚本层对象。根据万文网联盟制定的HTML DOM标准,HTML文档中的所有内容都是节点:
(1)整个文档是一个文档节点
(2)每个HTML元素是元素节点
(3)HTML元素内的文本是文本节点
(4)每个HTML属性是属性节点
(5)注释是注释节点 Weka基于特征组合的钓鱼网页检测系统设计(3):http://www.751com.cn/jisuanji/lunwen_22903.html