“给力”云数据中心

2014年元旦前后,国内云计算领域发生的几件事情引人关注:之前,亚马逊AWS、IBM SCE+ 宣布正式入华;之后,阿里巴巴、百度、京东、蓝汛、世纪互联等10家云服务商通过可信云服务认证。不难看出,国内的云计算市场在经历多年酝酿之后迎来发展的高峰。而在国外,有统计显示2013年的IT投入中,70%的CIO首先考虑云计算;在IT服务领域,云服务的占比上升至45%。随着基础设施的完善和应用的落地,云计算目前已经成为IT市场的强大力量。

云计算的实现离不开数据中心的支持,而云计算自身也在驱动数据中心变革。云计算架构的核心在于各类资源的虚拟化,与传统架构相比IT软硬件系统发生很大变化,特别是硬件,主要表现为IT设备的高度集中、高发热、高耗能,驱使底层的风火水电等配套设施相应作出改变。

——数据中心制冷系统的能效对PUE影响很大,台达上海运营中心机房采用“水冷”、“风冷”、“板式热交换机”三大散热系统并存的冗余设计。

数据中心的变化可以从“宏观”和“微观”两个角度去解析。在刚刚结束的2013IDC产业大典上,来自工信部的领导表示,目前数据中心呈现规模化、绿色化的发展态势。2013年8月份国务院发布的《国务院关于促进信息消费扩大内需的若干意见》提出了统筹互联网数据中心等云计算基础设施布局的发展方向,在同期发布的关于加快发展节能环保产业的意见则重点提出了开展数据中心节能改造,降低数据中心、超算中心服务器、大型计算机冷却能耗等要求。

“宏观”的大方向可以归结为规模化和低能耗,其核心在于追求PUE以及数据中心总能耗的降低。然而,数据中心内部IT设备在朝着高密度、高热量、高耗能的方向发展,因此“微观”面与“宏观”面看起来是背道而驰的。以Google数据中心为例,Google提出“容积比”的概念,数据中心单机柜设备密度很高,电量消耗巨大,平均每机柜供电功率要求高达14KW。这个数字究竟有多高?根据机房电源专家、中达电通关键基础架构产品开发处高级经理李南的介绍,传统数据中心单机柜供电功率一般在2KW3KW之间,云数据中心单机柜一般能在7KW8KW,而能够达到10KW就算很高了。由此可见,Google在供电功率的要求上达到一个极致。

不难看出,云数据中心基础设施建设需要解决两个问题:一是供电功率的提升对电源部分的要求;二是高密度、高功率带来的高发热问题对制冷系统的要求。云数据中心由于虚拟化技术的应用给供电和制冷带来的显著问题是“动态负载”。据李南介绍,动态负载是由虚拟化技术带来的机柜负载大幅度跳变,“比如上午某机柜负载功率是5KW,而到了下午很有可能转到了其他机柜。在日常运行中,负载动态变化对供电的影响较小,对环境基础设施影响较大,尤其是制冷系统。”一般情况下,数据中心制冷的能效决定了PUE的高低。所以,电源和制冷系统是否“给力”,是云数据中心是否符合“宏观发展”的关键。

供电设计多样化 直流UPS领风骚

数据中心对供电的首要诉求是稳定性,即保障数据中心业务稳定、安全、可靠地持久运行。不过,行业属性对可靠性的要求存在较大差异。李南比较了传统互联网和金融业,他说:“如果用户浏览百度时忽然间中断几分钟,可能大部分人不以为意,但是银行数据中心一旦发生宕机,其损失和影响非同小可。对银行来说,供电稳定是业务安全的一部分,又提高了一个层次。数据中心的差异,如同过去 IDC机房区分VIP区和普通用户区,都源自客户的不同要求。”

云数据中心供电设计面对的问题可概括为:设备集中、供电集中、热量集中、动态负载。李南表示,与过去相比,密度提高以后供电设计也发生改变,原来的数据中心多采用集中式供电,但现在超大型的数据中心耗电量惊人,需要将原来的大集中式供电变成区域式供电,同时运营商也在尝试分布式供电(一个电源带几个机柜)。“电源有容量的限制,所以集中化带来不同的供电模式,而且这三种方式都有应用。这是设计方法上的变化。”

可靠性的执行有标准可依,如TIA-942。据李南介绍,以Tier4为例,在供电上要做双系统,即通常讲的2N系统,两条母线同时运行,当一条母线出现问题,另一条母线可以完全担负所有负载。具体到产品上,直流UPS由于减少了逆变环节,实际上提高了系统的可靠性,同时在成本上也会更低。他说:“中达电通是国内最早做直流UPS的厂家,产品已经在某运营商部署并稳定运行3年时间。”业界普遍认为直流UPS代表UPS未来的发展方向。而对于目前没有大面积推广的原因,李南认为有以下几点:第一,直流UPS尚未形成统一标准,无法满足合规要求。第二,标准的改革牵涉各方利益,IT厂商不愿意过多地调整电源输入端。第三,客户的习惯不容易被打破,虽然互联网企业和运营商有意愿也善于尝试新技术,但其他的行业用户由于技术较弱相对保守一些。“传统金融业比较特殊,比如银行的技术较强,但是由于业务的敏感性,他们不愿尝试新的技术。”他说。

多手段降低PUE 数据中心运营更给力

数据中心的可靠性固然重要,但李南也提到成本的重要性:在很多互联网企业眼里,他们更青睐降低PUE,愿意牺牲一定的可靠性换取更低的能耗以节省成本。由于互联网企业的数据中心长年运行,此举节省的运营成本非常可观。李南将这类数据中心描述为“规模大,PUE低”, “在能耗方面,类似百度和Google这样的公司会想很多办法,比如百度尝试使用了UPS的ECO(经济模式)功能,即市电常供,出现问题后切换到电池。ECO模式带来供电效率的提高,虽然提升的量很小,但却值得百度这类规模巨大的数据中心去关注。目前国内用户很少会选择UPS的ECO功能,但国外已经比较普遍了。”

——能源管理的重要性已经获得业界认同,台达EMS3000可对机房能源实现动态管理,有效降低PUE。

这种牺牲一点可靠性换取经济性的方法值得借鉴。因为云计算能够实现对资源的随时调度,理论上一个节点的故障不会影响整体业务的运行。不过李南指出,供电的努力对PUE的降低非常有限,更大的发挥空间应该在制冷系统。“整个供配电系统从最前端到最后端,直流相比交流的效率提升为0.5~1个百分点。所以机房里供电的改善不是主要的,对PUE的降低贡献最大的还是冷却部分。”他说。

李南指出,在制冷上降低PUE可行的方法,一是封闭冷热通道,投资低见效快;二是使用冷冻水型的空调。毫无疑问,免费制冷是降低PUE值的最佳手段,但对选址的要求比较苛刻,并非可以普遍推广的手段。而中达电通的台达机房空调节能解决方案应用精密空调和先进的节能空调技术,精密掌控温湿度,维持机房最佳状态,节能达30%。来自ICTresearch去年的数据显示,机房节能空调现在占比约为整体市场的50%,而在未来5-8年,节能空调的比例将占整体的市场70%以上的规模,达到28亿元左右。

李南说:“真正谈到PUE,要看两个方面,一是要看冷却怎么做,另一个要真正把能耗管理起来。”中达电通提供的台达数据中心环境监控管理系统EMS,可以做到能源动态管理,而非传统数据中心只做动力环境监控。EMS能够对整个数据中心运行以后的动态PUE进行监控,通过监控各个时段显示的PUE数据,可了解机房设备的能源消耗情况,实现PUE的实时监控与分析。目前EMS3000已经入驻陕西广播电视台,为其提供从UPS、配电、精密空调、机柜及配件到环境监控系统的InfraSuite完整解决方案。

“只有发现问题才能解决问题,所以管理是很重要的事情。你是否真正理解你的机房,真正了解能耗在哪?”这是李南发人深省的一问。正是基于这样的认识,中达电通为数据中心运行理清了脉络,真正成为云计算的“给力者”。

;