从文献[4]可知,Map/Reduce是一种广泛用于构建大规模数据处理应用程序的分布式计算模式,当在云环境中使用时,Map/Reduce集群利用虚拟机被动态的创建和被云提供者管理,利用特殊的时空权衡可以实现能量感知。云计算中能耗消费能源最多的是数据中心[5],其中云计算中心的能耗又主要来源于三个方面:空闲能耗,执行能耗和配套冷却设施的能耗。现有的节能机制按照能耗降低阶段的不同可分为三类:关闭/开启技术、动态电压/频率调整技术、虚拟化技术。在本文中我们的研究也是基于Map/Reduce模型的云环境资源调度问题,主要依托的是虚拟化技术。
1.2 研究背景
云是虚无缥缈的东西,而它在计算机中的含义也同样是指看不见摸不着的指因特网,因为过去也一直将因特网画成一朵云(图1-1)。而云计算这个通用的术语,定义有多种说法。国内较为广泛接受的定义是著云台给出的:“云计算是通过网络提供可伸缩的廉价的分布式计算能力”。 无论是称为云计算或按需计算、软件作为服务、互联网作为平台,共同的元素是在地里位置的计算上的一个转变,当你使用谷歌的文档服务创建一个电子表格时,使用的软件的主要部分是驻留在看不见的电脑上的,这个电脑下落不明,很有可能分散在各个大陆[6]。并且,对于用户而言是透明的,根本无需知道云中是如何工作的,他们只需要一个瘦终端来访问因特网中丰富的资源。然而,随着用户的任务数量持续不断地增大,数据中心的规模也不断的扩大,能耗也会随之上升,合理的虚拟机资源分配与调度策略成为工作中的重要环节。
图1 看似“云”的互联网
德国的一家名叫Enlogic公司曾想通过对设备进行合理优化来达到降低云计算数据中心的能耗优化问题,这样就能使云计算数据中心的运行状况更加透明。据国际性的非政府组织---绿色和平组织(Greenpeace)2012年的一份调查,如果统计世界上所有的云计算中心的耗电量,会得出一个惊人的结果,假如把所有云计算中心算作一个国家,那么这个国家将是世界上第五大能源消耗国,排在美国、中国、俄罗斯和日本之后。这个耗电量非常大的虚拟的“云国”仅仅排在印度之前。人们对云以及云服务需求的增长,导致云计算中心数量和规模的不断增加,与此同时,这些计算中心所消耗的能源也在增加[7]。
云计算在我国的市场规模也非常大,对云计算的研究也是如火如荼的发展,并且云计算成为第三次IT浪潮,和中国对云计算的扶持政策在一定程度上有很大关系。清华大学也推出了透明云计算平台[8];2014年1月份,曙光、NVIDIA和思杰推出了“云图”;除了上述研究,2014年5月6日,阿里云开放北京计算数据中心,这就能对我国众多的互联网公司和企业提供跟好的的服务。最后就最近几年新兴起的4G网络也为云计算的腾飞而助翼,而这未来的4G必会带给我们更加自由的沟通。
1.3 节能策略
按照计算复杂性理论研究问题求解的难易程度,可把问题分为三类:P类、NP(Non-deterministic Polynomial非确定性多项式)类和NPC(Non-deterministic Polynomial complete problem非确定性多项式完全问题)类,而资源调度是个NP完全问题。
目前,云数据中心的节能算法和策略有下面一些:动态电压频率调整(DVFS)技术,根据P=CV2F能耗模型,降低机器闲置时段的频率和相应的电压,就可以达到节能的目的[9];宋杰等学者提出了能效是能源和效率之间的比值,而测量能效最重要的是测量单位时间内处理的任务量和耗费的电能[10];引用的文献很多都把虚拟机问题抽象为NP难的装箱问题以达到减少数据中心能源消耗的目的如[11-12];而文献[2,8]都是从资源调度角度来研究和讨论的,本文也基于虚拟机调度策略。 云环境下基于能耗优化的资源调度分配算法(2):http://www.751com.cn/jisuanji/lunwen_6249.html