服务器机柜的共享风扇散热研究

(整期优先)网络出版时间:2018-06-16
/ 2

服务器机柜的共享风扇散热研究

李波田东顺李连提

(积成电子股份有限公司山东省250104)

摘要:随着网络化的发展,数据中心在企业中的应用越来越广泛,而作为数据中心的构成单元-服务器机柜的安装密度不断增加,同时由于服务器性能的提高,元件的数目和功耗急剧增加,从而导致服务器散热阻抗大、热流密度高、散热性能差,严重影响机柜性能,甚至有热失效现象出现。基于此,本文主要针对服务器机柜共享风扇散热方面的内容进行了分析探讨,以供参阅。

关键词:服务器机柜;共享风扇;散热

引言

设备内各个元件的失效率直接影响到整机的可靠性,目前很多大功率元器件仅仅依靠外壳封装散热,而由于其外壳尺寸有限,且对流系数低,散热性能差,无法满足散热要求,需增加合理的散热器甚至使用风冷或液冷散热才能满足散热设计需要。在满足热设计规范的情况下,通过合理的散热设计,可以降低散热设计成本,降低风扇噪音及功耗等,提升产品竞争力。

1服务器机柜热设计分析

1.1传统散热方案和共享散热方案的分析

服务器机柜中通常使用1U、2U、3U、4U及刀片式服务器,使用风冷强迫对流散热或液冷强迫对流散热,目前机柜中液冷散热因尺寸限制、加工技术限制、售后维修限制等因素制约,市场占有率较低,故机柜多数采用风冷散热。服务器机柜中采用共享散热和电源集中管理方案后,单台服务器中不再安装电源及散热风扇,直接将共享风扇固定于服务器外面机柜上。共享风扇散热一般使用较大尺寸风扇,几台服务器使用一组风扇进行散热,减少风扇数目,降低总体风扇成本,而且服务器内部因无风扇安装可以腾出更多空间进行设计,另外风扇采用热插拔方式,维护简单方便。使用共享风扇散热后,3台服务器只需3pcs风扇进行系统散热,具有更高的散热性能,风扇整体数目大幅减少,导致风扇功耗和成本均会有所下降,并且具有失效率较低,易维护等特点。

1.2共享风扇的特点及布局

共享风扇由几颗风扇组成风扇模组,同时对多台设备进行散热,不存在单颗风扇只对一台电子设备进行散热的情况。为了满足热设计与维修性相结合原则,单颗风扇及模组风扇的固定采用卡扣式固定设计,具有支持热插拔功能的优势。在热设计过程中,风扇数目越少,失效率越低,成本越低,这必然要求使用大尺寸风扇进行散热设计。当前市场上主要有AC、DC和EC三种散热风扇。

1.3机柜的散热设计

机柜由机架、前后门板以及侧板组成,一般具有长方体的外形,落地放置,底部安装有万向轮和安全阀,以便移动或固定放置;其结构应具有良好的刚度和强度以及良好的电磁隔离、接地、噪声隔离、通风散热等性能。此外,服务器机柜必须有良好的抗振动、抗冲击、耐腐蚀、防尘、防水、防辐射等性能,以便保证设备稳定可靠地工作。在主要空气流通方向上,尽量减小结构尺寸或增加开孔虑,以免出现阻碍气流通过现象;另外机柜内的线材布置方式必须合理,不合理的布线阻挡了空气的流通,不仅会造成热空气滞留在机柜内,并使热空气回流至进风口,形成空气短路循环通道[18]。作为数据中心的构成单元,一套完整的服务器机柜主要包括机架、机柜主体-服务器、气体管理单元-散热风扇、供电设备一般为ACPower,安装固定配件、网络交换机、线缆等。本课题机架包括支撑结构、移动固定设备以及侧壁挡板,此外附件还有风扇模组、服务器、供电设备、网络交换机、客户Logo;根据散热要求,前后门必须在保证结构强度的前提下预留通风孔,以方便冷空气流入,热空气流出;侧壁安装有L型挡板,使上下两台服务器间距为1.2mm,方便服务器的安装与维护,同时防止气流从服务器与机柜之间流过,避免漏风回流现象发生。

1.4共享风扇性能参数的设计

本课题选用3颗DC风扇同时对3台服务器进行散热,风扇的选择要合理,不能因散热要求一味的选择大流量,高功耗,高静压的风扇,造成成本浪费。风扇的参数设计思路如下:根据系统功耗及设计条件推算系统散热所需流量,选择P-Q适合的风扇进行散热。

2机柜中服务器的散热设计

本课题机柜中使用的为1URack服务器,其热设计的目的是对电子元件、组件以及整机的温升控制,尤其是对发热功耗大的元器件的温升控制,如CPU及其供电元件等。

2.1散热部件的开发

本课题采用120mm×38mm风扇进行散热,单体风扇支持热插拔,三个风扇为一组,同时对三台服务器进行散热。

2.2CPU散热器

机柜中每台服务器使用两颗CPU散热器,CPU功率为115W,其热量主要有对流散热完成,其中很小一部分由辐射散热完成,虽然CPU基座为金属结构,但其Pin脚为顶针结构,和CPU接触面积较小,并且基座和主板连接,一般认为CPU热量主要通过传导到散热器上进行散热,不考虑从主板散热部分。

2.3芯片散热器

由于MCH、LanChip元件功耗较高,芯片较小,芯片自身无法满足散热需求,故使用散热器进行散热;同时由于后端CPUVR及DIMMVR进风口温度较高,故亦需使用散热器进行散热,而前段CPUVR及DIMMVR进风口温度较低,自身散热可以满足需要,不使用散热器进行散热。

3服务器机柜的散热验证

3.1散热验证的方案及步骤

由于本机柜服务器较多,不可能每个服务器都进行详细的散热实验,故散热方案的验证会分为下面几个步骤进行:(1)散热验证的准备工作,包括在机柜中通过实验验证找出散热条件最恶劣的服务器和实验仪器的准备、关键元件的功耗测量、测量点的分布与粘贴固定等。由于服务器中元件较多,故使用散热风险最高的元件进行判断,本专案中使用服务器中后端CPU进行对比,服务器中CPU温度相对最高的服务器散热条件最差。(2)针对散热条件最差的服务器进行详细验证,得出关键元件的温度,判断散热方案是否可行。(3)对服务器及机柜进行散热优化。(4)验证优化方案是否有效。(5)风扇转速自动控制时的逻辑关系及系统散热验证。(6)分析仿真精度误差及原因。

3.2散热验证的准备工作

3.2.1散热条件最差服务器的确定

根据仿真数据表明,服务器中温度最高且散热余量最小的元件为CPU,针对这种现象,直接在机柜中读取各服务器CPU温度,默认为温度最高的服务器散热条件最差,后续将针对此位置散热器进行详细散热验证。测试前首先必须将服务器机柜组装起来,要求每台服务器必须使用相同配置,机柜中所有服务器、电源模组、网络设备、风扇模组等全部安装完毕,以免有漏风现象,造成测试数据误差等。

3.2.2测试仪器的说明及使用

为增加测试数据可靠性,服务器直接放在机柜中进行散热测试,由于机柜尺寸较大,无法进入恒温恒湿柜,故直接放在会议室中进行,通过服务器共同工作对房间进行加热,再结合排气扇控制环境温度,此处环境气流满足实验标准,即实验对象附近的空气流动速度不高于1.7m/s。

3.2.3关键元件功耗的测量

由于实际测试时元件负载达不到TDP,测试温度偏低,故测试前需对关键元器件功耗进行测试,以便数据推算至TDP确定是否满足散热设计需求。为了确保推算数据更准确,服务器温度测试一般使用重载测试,即测试配置使用满配且使用器件功耗相对最高,接近TDP。

3.2.4测量点的分布

虽然仿真结果显示散热设计满足散热要求,但元件温度越低,其失效率越低,如P111500芯片,其温度每降低10℃,失效率将下降4%,所以散热方案优化有其积极意义。

结束语

综上所述本课题就是针对热失效问题进行散热研究,从机柜、服务器、芯片三个层次进行散热设计,使电子设备中各元件在满足散热规范温度的状况下运行,避免元件的热失效问题,提高设备的可靠性。

参考文献:

[1]徐闯.基于SiC器件的Buck变换器损耗分析及热特性研究[R],2014:14-15.

[2]董永军,朱永平.电子产品的可靠性设计[J].长沙通信职业技术学院学报,2016(02):33-40.

[3]曾声奎,赵延弟等.系统可靠性设计分析教程[M].北京:北京航空航天大学出版社,2011:54-61.