5.2 本文的不足 . 46
5.3 展望 . 46
致 谢 47
参考文献.. 48
1 绪论
1.1 课题研究背景
1.1.1 数据挖掘的技术需求
我们现在已经生活在一个网络化的时代,通信、计算机和网络技术已经改变
并将继续改变整个人类和社会。如果用芯片集成度来衡量微电子技术,用 CPU
处理速度衡量计算机技术,用信道传输速率来衡量通信技术,那么摩尔定律告诉
我们,它们都是以每 18 个月翻一番的速度在增长。实际上,今天网络的发展速
度已经超越了摩尔定律,全球 IP 网发展速度早在几年前都达到了每 6 个月翻一
番的速度。网络技术的发展就是信息的发展,现在每天在Internet 上传输的数据
量已经很难用某一个单位来衡量了。在这样一个信息爆炸的时代,如何才能不被
信息淹没,而是从中即使发现有用的知识、提高信息的利用率,这已经成为人们
不得不思考的问题。
数据挖掘是人们长期对数据库技术进行研究和开发的结果。 起初各种商业数
据是存储在计算机的数据库中的,然后发展到可对数据库进行查询和访问,进而
发展到对数据库的即时遍历。数据挖掘使数据库技术进入了一个更高级的阶段,
它不仅能对过去的数据进行查询和遍历, 并且能够找出过去数据之间的潜在联系,
从而促进信息的传递。
这些年来,随着计算机网络技术特别是网格计算与云计算的发展,越来越多
的数据分布式的存储在网络中,这些海量的、分布式的、异构的、复杂的数据给
数据挖掘系统的实现带来了两大难题:首先,处理这些数据的复杂度很高,系统
的计算能力很难达到要求, 此时传统的单机服务器所能提供的有限计算资源往往
不能满足要求,需要借助分布式云计算技术来实现大规模并行计算
以上是对于数据挖掘软件的要求,而更深层次的讨论,数据挖掘软件的运行
必须要架构在各种各样的硬件基础上。从更大的角度来看,网络技术和计算机硬
件技术的发展也在一个很重要的程度上限制着数据挖掘技术的发展。 硬件支撑对
于海量数据的处理能力和计算能力是今天的数据挖掘技术要重点考虑的课题。 早
在1977年 Friedman就列举了四个主要的技术需求激发了数据挖掘的开发、应用
和研究的兴趣,一直到今天,数据挖掘技术的发展还是沿着这个方向前进:
超大规模数据库的出现,例如商业数据仓库和计算机自动收集的数据记录;
先进的计算机技术,例如更快和更大的计算能力和并行体系结构;
对海量数据的快速访问;
对这些数据应用精深的统计方法计算的能力。
1.1.2 云计算的发展现状
云计算从概念提出至今已经发展到一定阶段了, 由于它是多种技术混合演进
的结果,其成熟度较高,又有大公司推动,发展极为迅速。云计算的产生大致经
历了四个时期,分别是网格计算、公用计算、软件即服务,然后才真正进入了云
计算的时代(如图1-1)。之前的三个时期,计算机的某方面的技术都有触及到云
计算的思想, 都有提出类似云计算的想法, 但是都没有具体的概念和形象的认识。
可以说前面的三个时期的云计算的思想都没有明确的形成。直到Google将云计
算作为一个具体的概念,形象的呈现在人们眼前。众多的IT精英和专家们才真
正认识并开始了解云计算的“庐山真面目” ,纷纷大步向前,进入云计算的广阔 基于云平台的应用研究+文献综述(2):http://www.751com.cn/jisuanji/lunwen_6626.html