关于企业数据中心服务器机架的整理
本文中,我们将为广大读者朋友们介绍关于企业数据中心服务器机架整理的相关概念,将机架定位为数据中心的气流管理设备,而非惰性商品。文章中,我们将通过定义可量化的气流泄漏的基准测试方法作为设置机架性能目标的手段,进而为大家介绍机架级别的解决方案。
今天,虚拟化技术正在快速的被越来越多的IT企业组织所广泛采用。而IT企业组织积极的部署这项技术的关键驱动要素便是为了能够降低与服务器,存储和网络设备整合相关的运营成本。这种新型的虚拟化数据中心操作运营环境所带来的副产品还包括IT设备和相关占地空间的净减少。同时,由此产生的电力和制冷负荷会缩小到更小的占地面积,并与IT处理负荷具有动态关联。
虽然传统的散热架构可以适应新的数据中心操作运营环境,但由于其所具有的以下固有的设计方面的缺陷,其通常效率低下:
冷热空气混合
冷却装置和IT机架未对齐
由于冷却装置上的热负荷不平衡,本地无法抑制热量
制冷设备和热负荷之间的距离过大
空气分配受到过多的电缆负载的影响
传统冷却基础设施无法对动态化的热负荷做出反应
缺乏气流管理以适应侧面到侧面的排热装置
冷空气供应过剩
密封遏制战略正在得到企业数据中心的IT和基础设施经理们的认可,他们希望优化数据中心现有服务器机房的布局。随着热气流和冷气流的密封遏制解决方案的逐渐普及,有必要密封气流中每个关键部件的所有气隙,进而获得最大的效益。这种方法现在被部署在管理良好的数据中心活动地板中,使得密封所有潜在的空气泄漏间隙对于保持均匀的底层静压和气流分布无疑是至关重要的。
图1、使用冷气流以显示典型气隙的机架CFD模型
“机架”是运营管理人员们在数据中心的气流管理过程中被容易遗忘的但却最为关键的部件。在机架中,漏气情况十分严重(如上图1所示)。这会导致再循环和旁路气流效率低下。尽管目前的安装在机架中的IT设备均普遍遵循EIA-310行业标准,但在机架环境内,目前并没有管理热气流和冷气流的相关标准。
企业数据中心机架的发展演变
在过去的十年中,机架已经发展成为主导的气流环境。玻璃门已被穿孔门所取代,这些门从45%的开放区域进化到今天的65%(乃至更多)的开放区域,以实现最大气流。在许多情况下,前门被完全取消。
屋顶风扇托盘已由后门风扇取代。冷却盘管已集成整合到后门上以促进“从前至后”的气流流动。热密封遏制管道系统演变成一种从机架中排除热空气的方法。同时,网络电缆的功率和尺寸大大增加,导致额外的机架杂乱和机架内气流阻塞的可能性增加。
因此,机架深度已增加到42英寸,甚至达到48英寸,以适应服务器外形的深度,在后方(服务器后方)提供电源分配,电缆管理和增加的气流。
假设与机架内空气阻塞有关的所有变量都是恒定的,增加的机架深度对气流有中性影响。尽管采用了隔热措施,但更深的机架(> 42英寸)可提供更多空间向上排放空气,而不是简单地将其推入机架后部。
尽管宽度为30英寸的机架对于采用“从侧面到侧面”冷却交换机的网络应用程序来说是很常见的,但服务器机架宽度的行业趋势仍然是24英寸。然而,现在在服务器应用程序中部署30英寸宽的机架并不罕见,更宽的服务器机架使得最终用户能够通过将配电和数据电缆远离热空气排放流来减少气流阻塞。
在大多数情况下,服务器机房的几何形状将决定机架得高度。最常见的服务器机架高度大约为7英尺,这为机架式设备提供了42U的内部安装(1U = 1.75英寸)可行性。然而,网络设备与服务器的融合则推动了机架高度提升到接近8英尺(51U)。
42U以上的附加机架安装空间通常安装有网络交换机、路由器和配线架。更高的机架可容纳更多机架式IT设备。这导致更高机架的热密度更高,因为空气分层使得难以确保最佳入口温度。
机架作为集气室
当今的冷热空气密封遏制解决方案高度依赖与机架的紧密接口。因此,有必要改变我们对当今数据中心操作运营环境中机架及其功能的看法。
机架应该被认为是气流中的“充气室”。与典型的空气管道通风系统不同,机柜气室是高性能服务器、存储和交换机所处的关键空间。为确保足够的IT设备冷却,需要可预测的机架级气流管理。为了达到这一目标,所有潜在的气流开口都应该被控制和管理。除了密封机架中未使用的U型空间外,至少还有五个与机架相关的区域可以直接影响气流管理和冷却性能,并提高能源效率。
关于服务器机架整理的概述
机架整理的概念是一个术语,其包括识别、分析和修理数据中心个别机架内和周围的热空气泄漏区域/气流注入路径和冷空气旁路路线。
数据中心服务器机架整理是一个新创造的术语,用于描述服务器密封机架的设计,控制和维护的过程。密封机架由从地板到机架顶部的整个空间组成;也可以是从地板以上的空间,包括一直到“加热甲板”的机架上方的空间。
无论机架的尺寸如何,数据中心专业的操作运营人员们都有义务采用在前后支配的气流环境中围绕机架前面板提供不可穿透的屏障的解决方案。围绕机架前部提供的密封遏制更严格——不包括彻底的下控面板策略——以便更好的实现机架整理。
通过解决机架前部周围几个点的空气泄漏问题,可以减少供气路径的Delta T和返回路径的Delta T,从而提高能效。因此,不需要空调机组弥补数据中心热点和气流异常的需求。
服务器机架整理最佳实践方案的两大主要驱动因素是:
l 热点防控。这有助于保持恒定的入口温度,并允许IT设备以最佳水平运行。
l 匹配冷却供应和需求。这可以节省能源,并消除作为“混沌冷却方法”(将冷空气过度供应到数据中心)的一部分的浪费再循环和旁路空气流。
在机架和机架行级别的无效的机架气流管理是导致过道和服务器机房过热的关键因素。机架整理可以通过将机架作为气流管理系统的一部分,并设置基准泄漏标准来解决此问题。
五个气流易故障区域
虽然业界已经从挡板最佳实践方案中了解到了这些对于数据中心的益处,但这只是机架整理方法中的一种气流抑制措施。当有人讨论基于机架的气流管理故障时,有多达五个额外的机架相关区域需要进行遏制。这些故障区域可以在前后冷却的区域推动真正的性能提升。这些区域被称为五大气流断层区(如下图2所示)的区域包括:
机架下(机架外部)
19英寸垂直安装围栏左前方(机架内部)
19英寸垂直安装围栏的右前方(机架内部)
底部机架安装空间下方(机架内部)
机架顶部安装空间之上(机架内部)
故障区域#1:在机架下方
机架下的区域可能难以管理,因为这一区域的高度是一个基于机架平衡机脚轮尺寸的变量,会因机架制造商的不同而异。 该空间可以在具有多行服务器机架的企业数据中心中包含大量不受控制的空气。 因此,如果适当密封,或将是能够带来巨大益处的领域。
通常,由于对电源和网络连接的要求,机架下面没有固体面板。这是一个潜在的泄漏区域,因为热空气可以从机架下方穿过,并且来自穿孔地砖的冷空气可以绕过这个空间的机架。
故障区域#2:19英寸垂直机架围栏前部的左侧和右侧
由于企业客户对于前部围栏和电缆通过方面具有可调节的功能需求,大多数19英寸机架前部围栏的左侧和右侧区域都是潜在的泄漏点,垂直围栏侧面与机架框架的侧面或侧面板通常是敞开的,这是一个潜在的泄漏区域,冷热空气均可以通过该区域,这种机架环境可能会严重影响坚固的挡板策略。
今天,更宽的机架(例如,30英寸)在19英寸围栏的每侧还有3英寸的空间用于冷却侧面到侧面的交换机,或用于管理大量网络电缆的空间。为了达到侧面或到顶部,电缆通常会穿过未密封的开口。这些开口应覆盖了一层材料,以便在电缆周围提供密封,以最大限度地减少空气泄漏。
故障区域#4和#5:垂直机架安装空间的上方和下方
顶部U空间上方和底部U空间下方的区域也是可疑泄漏的区域。通常情况下,这些区域存在一定量的空间,并且会因为具体机架的制造商的不同而存在差异。然而,这个空间与缺失的挡板并不罕见。
这个区域不仅容易受热空气再循环的影响,而且更有可能绕过CRAC空调机组的冷空气供应。
图2、机架易出现故障的区域
测量
正如使用PUE和DCiE这些指标来测量数据中心的效率一样,数据中心的运营管理人员们同样应该测量机架的效率,以促进适当的气流管理。衡量机架整理和降低数据中心能耗的正确方法。即为既定的数据中心设施建立基线和跟踪性能。
基准测试方法为数据中心的漏风设定了性能目标。通过将虚拟模型与测量的测试结果相结合,可以精确定位数据中心内出现气流管理问题的具体位置,并采取相应的纠正措施,以改善气流遏制。
基准测试过程会将性能的分级标准分配给:
识别数据中心的能源概况问题
分析数据中心能源绩效,以获得潜在的改进
以节能的方式添加高密度服务器,并提高机架密度
确定并选择高效的数据中心冷却方法
预测新建和未来设施扩建的设计限制
为了测量气流的泄漏情况,数据中心设计要按照规范要求设计,并提供最大额定风量(CFM)的服务器机架,以满足满载额定值。机架前部的机架内压力不应超过0.001 英寸/H20。理想情况下,机架中的IT设备正在耗尽空气,而不会产生任何明显的背压。考虑到这一点,从机架正面到背面的测试压力必须设置为不超过总表面积的3%或更小的最大间隙。因此,将需要建立相关的标准,要求测量的空气泄漏量达到总供气量的3%。
测试
为了测试机架,并确保它们符合所需的规格,数据中心管理运营人员们将执行以下测试:
测量泄漏区域的整体间隙(它们将按照与机柜外壳入口总表面积的比率来衡量)。
测量环境是否可以保持3%或更少的空气泄漏(风扇将用于对密封的密封架加压)。
测绘和识别机架内的泄漏区域(雾发生器将用于追踪和检测所关注的区域。)
数据中心测试应包括五个气流易故障区域:
1. 机架下方(机架外部)
2. 19英寸垂直安装围栏左前方(机架内部)
3. 19英寸垂直安装围栏的右前方(机架内部)
4. 底部机架安装空间下方(机架内部)
5. 机架顶部安装空间之上(机架内部)
测试内容包括需要确定如下方面:
耐受压力范围:确定封装的有效工作范围
泄漏等级:测量U空间100%达到空闲时,在五个易故障区域内逸出的空气量
目标是零泄漏
企业数据中心的一个经过了密封遏制战略培训,且经验丰富的团队应该分析测试结果,并提供立即节能的成本节约解决方案清单。
报告内容包括:
测试结果的总结概述
每项测试的详细分析,包括:(进行测试的设施、基础设施和基准指标;用于进行每项测试的设备;用于进行每项测试的程序;如何收集和测量结果)
电子表格指示哪些机架已通过了每项测试或测试失败
一份摘要,说明哪些规范未得到满足,并需要进行改进的任何问题
结论
作为工程气流系统关键组件的机架的发展演化使得当下的企业数据中心变得更加节能,节省成本,并赋予了数据中心管理运营人员们更多的灵活性。
不幸的是,数据中心行业依靠对于工作场所的直觉和创造性解决问题的时间太长。其利用了从纸板和胶带到泡沫密封套件乃至其他“防风雨”设备的一切资源。但是,市场正在朝着在制造过程中设计和集成在机架内的标准化解决方案发展。
随着数据中心在机架和行级的密封遏制加强了其在改造和新建设中的立足点,更多的数据中心管理人员将把是否具备机架整理的元素作为未来机架采购的标准功能集,而不是高级选项。
冷热空气的分离极大地提高了数据中心性能的可预测性,并能够:
有效利用现有物理基础设施和冷却容量能力
主动控制和标准化供应温度,消除了再循环和分层
在数据中心占地面积较小的情况下,随着热负载的增加,需要少花钱多办事
消除“闲置”的物理、电气和机械容量能力
智能化的密封遏制战略始于机架,无论企业数据中心目前是否采用了冷通道或热通道密封遏制的方案。即使在传统的混沌冷却环境中,改进的机架整理方案也是减少数据中心内冷热空气流再循环和再混合的第一步。其可能占整个数据中心密封遏制战略的60%。