应时而生的一种解决网络服务安全问题的机制,全自动开放式区分计算机和人类图灵测试(completely automated public Turing test to tell computers and humans apart,CAPTCHA),即俗称的验证码技术,又称为人机交互验证(human interactive proof,HIP),它能自动生成一个测试并对其进行评估,这个测试必须能够方便所有真实人类用户通过,而已有的自动程序不能通过。CAPTCHA测试是图灵测试的逆测试,它提供了一种自动区分人和机器的手段,保护程序不被恶意破解攻击,已成为一种标准的网络安全技术,在互联网服务中被广泛应用于防止恶意程序访问和滥用服务资源。
1.2 课题内容
本设计中提出的基于互联网搜索引擎的CAPTCHA构造方法的实现技术,利用搜索引擎的图片搜索能力,根据关键字搜索并选择少量相关图片,混杂在大量非相关图片中。其中关键词、验证图片、相关图片的位置均为随机产生。并且随着数据库内关键词和搜索引擎中图片库的更新,验证图片的来源是不断变化着的。由于采用了互联网信息作为背景资料库,采用搜索引擎作为资料选择和判断依据,本方法可以具有动态的、海量的验证码构造结果,可以抵抗攻击者的暴力破解或者穷举尝试。
1.3 研究意义
CAPTCHA的设计基于人工智能(artificial intelligence,AI)学科的开放性原理,充分利用人类用户和计算机在解决相关问题上的不同,有效避免某些计算机程序恶意使用互联网服务。CAPTCHA的研究意义在于,如果研究者们研究出一种CAPTCHA识别技术,能够破解特定的CAPTCHA算法,即意着一个人工智能问题得到了解决,则形成有趣的“构造—破解—再构造”的循环现象,从而推动CAPTCHA技术的不断进步。而如果CAPTCHA技术始终无法被自动识别,并且从理论上被证明计算机无法破解,则证明该计算机无法通过图灵测试,达不到人工智能。CAPTCHA问题涉及人工智能、图像处理、文本分析、计算机视觉、模式识别等多个领域,对网络信息安全的文护具有重大意义。
2 研究现状与相关技术
2.1 研究现状
2.2 相关技术
2.2.1 统一资源定位符
统一资源定位符(Uniform Resource Locator,URL),又称作统一资源定位器/定位地址、URL地址等,有时也被俗称为网页地址(网址)。如同在网络上的门牌,是互联网上标准的资源的地址(Address)。它最初是由蒂姆•伯纳斯-李(Tim Berners-Lee)爵士发明用来作为万文网的地址,现已被万文网联盟编制为因特网标准RFC 1738。统一资源定位符的语法是统一并且可扩展的,它使用一部分ASCII代码来表示因特网的地址。基本的统一资源定位符包含模式(协议类型)、服务器名称(或称IP地址)、路径和文件名,如“协议类型://授权/路径?查询”。一个完整的、带有授权部分的普通统一资源定位符的语法结构如下:
模式://用户名:密码@子域名.域名.顶级域名:端口号/目录/文件名.文件后缀?参数=值#标志
即scheme://host:port/path?query#fragment
其中,scheme表示模式/协议类型,即通信协议方案,它告诉浏览器如何处理将要打开的文件。下表是scheme属性的有效方案名称。
表2.1 协议类型
协议类型 协议类型含义
file 资源是本地计算机上的文件
ftp 通过FTP访问资源
gopher 通过Gopher协议访问该资源
http 通过HTTP访问该资源
https 通过安全的HTTP访问该资源
mailto 资源为电子邮件地址,通过SMTP访问 基于Web搜索引擎的CAPTCHA构造方法实现(2):http://www.751com.cn/jisuanji/lunwen_19125.html