冷板式液冷的运维方法及注意事项

首页    资讯洞察    冷板式液冷的运维方法及注意事项

图片:由AI生成

 

 

01

冷板式液冷的应用

 

据AI治理中心(GovAI)的研究表明,目前用于训练AI的计算量每六个月就会翻一倍。

 

为使数据中心能支持更高算力和TDP的芯片,如英伟达H200(最大功耗可达700W),液冷成为了关键的制冷节能技术。据MarketsandMarkets预测,全球数据中心液冷市场规模预计将从2024年的49亿美元增长到2030年的213亿美元,2024-2030年的年复合增长率将达到27.6%。

 

冷板式液冷是一种较为成熟的液冷解决方案,其原理是在CPU、GPU、DIMM等核心发热部件上安装冷板,然后使用泵和管道将冷却液送至冷板一侧,通过液体流动将热量带走。加热后的液体通过CDU(冷却液分配单元)流向冷却塔,然后再循环回到冷板侧。

 

 

 

 

在冷板式液冷的实际应用中,运维是一个难题。一是传统制冷系统的运维方法和经验不完全适用,需要建立专门的液冷运维体系和培训体系。二是很多液冷机柜搭载价格高昂的芯片,如果发生漏液等事故,会非常“肉疼”。

 

中科仙络为全国40+数据中心提供代运维服务,运营多个液冷数据中心,万余架液冷机柜,单机柜功率均在20kW以上,积累了实用有效的冷板式液冷运维经验,分享一波

 

 

02

冷板式液冷的优势

 

冷板式液冷相比传统制冷方式,减少了制冷主机,更易于运维。

 

 1 

占地小

 

 

冷板式液冷的主要换热设备为板换,整套系统的占地面积和一台700冷吨冷水机组的占地面积差不多,节省建筑空间。

 

 2 

模块化

 

 

一个模块系统只服务一个机房,同一栋楼可以布置多个模块,互不影响。

 

 3 

设备少

 

 

主用设备为冷却塔和循环泵,相比传统制冷系统设备更少,系统运行风险更低。

 

 4 

供水温度高

 

 

传统制冷系统通常采用中温水系统,供水温度为12℃-16℃。冷板式液冷系统的供水温度可提高至25℃-30℃,减少了中间环节的温差换热损失,且可充分利用自然冷源散热,必要时可以直接使用软化水进行降温。

 

 5 

逻辑简单

 

 

除了冷却塔电动阀参与逻辑控制,其余设备均使用手动常开阀门,群控逻辑只涉及泵塔逻辑动作,比传统制冷逻辑简单。

 

 6 

应急互联强

 

 

为提高系统运行可靠性,成熟的液冷模块设置了应急补水。当冷冻侧设备故障时,可采用水池内存储的软化水(20℃左右)进行补给,实现与二次侧管路换热降温。模块与模块之间采用双管互联,并设置阀门隔离,必要时可共用换热。

 

 

03

冷板式液冷的运维方法

 

1

冷却液水质监测

 

 

运维人员巡检时,要监测冷却液的水质。结垢、泡沫、细菌等都可能堵塞管道,降低传热效率。运维人员还需检查冷却塔填料表面的结垢情况,关注冷却水的电导率、碱度、水藻滋生情况等。

 

我们建议每月对冷却液取样检测。冷却液的PH值应保持在7-9之间,电导率1800μs/cm以下,总碱度1000ppm以下,如此可以减缓板换的结垢速度,提高换热效率。若液面低于原定刻度、数值超标或结垢,则需补充液体、更换冷却介质等。

 

 

2

漏液防护

 

 

漏液是液冷系统常见的安全隐患。系统中使用的冷却介质一旦泄露,不仅影响连续性制冷,而且会污染环境,还可能会腐蚀组件和线路,导致短路,轻则影响系统性能,重则可能引发火灾。

 

如图所示,机房二次侧管路阀门多,快接卡箍多,漏液风险较大。

 

 

 

风险点1:主管道与支路软管连接处

 

主管道与支路软管连接处为薄弱环节,软管震动、暴力拉扯软管、静电地板脱落等原因,都可能导致卡箍处断开,从而引起漏液。因此,需要增强软管及卡箍处的固定,可以使用成品焊接件或更换成法兰连接。

 

 

风险点2:快接卡箍

 

快接卡箍不具备防脱功能,一旦脱落容易导致漏液,建议把开口卡箍更换为闭口卡箍,避免脱落风险。对于已有的、不方便更换的开口卡箍,可以使用金属扎带捆扎固定。

 

 

风险点3:模块定压补水装置

 

冷板式液冷系统将管路布置在地板下,机柜分布在地板上(高度2米)。如果管路漏液,压力迅速下降,机柜就会缺液宕机。运维时,建议使用模块定压补水装置或快速补液装置,稳定系统压力,快速补水。

 

 

3

定期检查维护

 

 

液冷系统的容错性低,任何一个组件和环节处理不好,都可能对整个系统产生影响,需要经验丰富的工程师定期维护、保养设备,检查关键运行参数,以保证散热效率。

 

 

核心设备1:冷却塔

 

冷板式液冷系统主要采用开式冷却塔,常见为横流塔,多台并联形式,N+1配置,环网运行。

 

日常巡检:重点监测水质;

 

季度维护:清洗冷却塔塔盘、冷却塔填料、液位浮子,检查清洗布水器,风机轴承加注润滑油,检查更换风机皮带;

 

年度维护:对冷却塔配电柜进行清灰紧固,开展电机绝缘测试和风扇动平衡测试;

 

 

核心设备2:循环泵

 

循环泵作为主要动力设备,经常使用单吸离心泵,多台并联形式,N+1配置,环网运行。

 

日常巡检:关注水泵运行频率和电流,关注过滤器前后压差,留意是否有振动和异响;

 

季度维护:轴承加注润滑油(非免维护轴承),紧固地脚螺栓,扇叶清灰,清洗进口过滤器(压差大于0.5bar);

 

年度维护:对配电柜清灰紧固,进行电机绝缘测试、震动等级检测和轴对中检测;

 

 

核心设备3:板换

 

板换作为主要换热设备,通常采用多台并联形式,N+1配置,环网运行。

 

日常巡检:重点关注冷却侧及冷冻侧进口过滤器压差,关注冷却侧进水温度与二次侧出水温度温差;

 

年度维护:清洗进口过滤器、板换翅片,对比板换冷却侧进水温度与二次侧出水温度,温差大于1.5℃则需清洗板换

 

 

核心设备4:CDU

 

 

CDU作为冷冻水与液冷二次侧工质水的主要换热设备,由板换、循环泵、电动阀等组成,采用多台并联形式,N+1配置,环网运行。

 

日常巡检:注意电动阀开度、循环泵频率、供水温度、压差运行值;

 

月度维护:进行漏水检测、工质水浓度和PH值检测、过滤器压差检查;

 

年度维护:重点进行电动阀开关检测和工质水细菌检测。

 

 

您可能还会想看👀

 
 
 
 

 
 

关于中科仙络💡

 

 

北京中科仙络智算科技股份有限公司成立于2007年,为客户提供有关数据中心基础设施的全生命周期技术咨询与专业服务。

 

我们在全国拥有1200+专业技术人员,主要客户包括电信运营商、互联网大厂、金融机构、IDC、政府机构及大型企业。

 

◾ 核心业务

数据中心全程咨询 | 认证咨询 | 测试验证 | 运维服务 | 节能改造 | 机柜托管及云服务

 

期待与您合作,打造高质量数据中心园区!

 

咨询热线:400-161-1386

咨询邮箱:market@banyano.com

 

2024年9月26日
浏览量:0
收藏

更多资讯