数据中心基础设施测试验证重点内容解析

首页    资讯洞察    数据中心基础设施测试验证重点内容解析

      通过结合数据中心建设各阶段的不同需求,对数据中心基础设施测试验证内容和特点进行分析,以满足实现数据中心持续运营的目标。

       一、数据中心测试验证在不同阶段的特点
  
  现代数据中心建设需要达到安全可靠、布局合理、功能完备、可持续发展、绿色环保等运营需求,切实为服务器等IT设备提供一个安全、可靠、温湿度及洁净度均符合要求的运行环境,同时为相关工作人员提供方便、快捷、舒适的工作环境,并为管理人员提供安全、高效的管理手段。为了确保数据中心的设施和设备能够稳定、高效地运行,测试验证已成为必要的解决方案之一。
  
  测试验证的核心目标是通过模拟负载工况,检验数据中心正常或发生故障时所有设施设备性能、功能、各种状态是否与设计意图符合,包括验证施工质量、设备质量、调试质量、各种逻辑功能等,并最终通过检测及完成验收。
  
  在数据中心建设的各个阶段都需要进行测试和验证,以确保数据中心的可靠性、可用性和安全性。如图1所示就是在不同阶段常见的测试和验证步骤:

  

图1  在不同阶段常见的测试和验证步骤


  1.1 设计验证
  
  在设计阶段,需要进行设计验证以确保设计符合要求。这通常包括对数据中心的可靠性、可用性和安全性进行评估,并进行各种软件仿真模拟测试,以确保设计满足数据中心的需求。
  
  1.2 建设验证
  
  在建设阶段,需要进行建设验证,通常包括对建设过程中的物理设备进行测试和验证,包括厂验、安装检查、功能测试等,以确保设备和子系统能够满足数据中心的需求。通常还包括对各个系统组件进行性能测试和负荷测试,以确保它们能够承受实际工作负载,并且能够保持高可用性。
  
  1.3 安全验证
  
  在测试阶段需要进行安全验证,包括测试门禁系统、监控系统和消防系统等指标,以确保数据中心的安全性。数据中心需要提供良好的物理安全措施,以确保客户数据的安全。
  
  综合联调
  
  在集成阶段对数据中心整体进行联合调试,以确保各个系统和组件能够协同工作,并且符合数据中心的需求。这通常包括对电气、暖通、监控和安防等系统进行测试和验证,以确保它们能够协同运行。
  
  1.4 操作验证
  
  在运维前介阶段需要进行操作验证,同时包括多种灾备、容错场景演练,以确保数据中心的操作符合预期,并在过程中建立和优化SOP(Standard Operating Procedure,标准操作程序)、MOP(Method of Procedure,标准维护程序)、EOP(Emergency Operating Procedures,应急操作程序)等操作规程文档。图2示出了电源质量波形测试图。

  

图2  电源质量波形测试图


  需要注意的是,测试和验证是一个持续的过程,而不是只在特定阶段进行一次性测试。基础设施应该定期进行测试和验证,以确保它们始终符合预期要求。同时,在数据中心运营阶段,也需要定期的检测评估,以满足数据中心的可持续性运营。
  
 
 二、建设阶段的关键子系统测试
  
  在子系统测试中,电气系统和暖通系统是数据中心的两大关键系统,也是测试验证的重点环节。数据中心的设备需要持续的电力供应,因此,电气系统测试是非常重要的,其中包括测试备用发电机和UPS(不间断电源)系统是否能够正常工作,并且在停电情况下能够维持足够的电力供应。同时,数据中心的设备需要保持在适宜的温度和湿度条件下运行,离不开暖通空调系统的支持作用。
  
  2.1 电气系统测试
  
  1)
电源稳定性测试
  
  在测试验证期间,需要测试数据中心的电源系统是否能够稳定地提供电力供应。测试过程中需要检查电压、频率、波形等参数是否符合标准要求,并测试系统在高负荷情况下的稳定性。
  
  2)
UPS稳定性测试
  
  UPS(不间断电源)是数据中心电源系统的重要组成部分,能够在停电情况下提供稳定的电力供应。在测试过程中需要测试UPS系统是否能够正常工作,包括测试电池寿命、切换时间等指标。
  
  3)
电源备份测试
  
  数据中心需要备用发电机来应对长时间停电情况,因此需要测试备用发电机是否能够正常工作,并测试其在负载变化时的稳定性,包括启动测试、供油系统测试、控制逻辑验证、稳态运行验证、运行发热验证、瞬态响应验证等。
  
  4)
电源质量测试
  
  数据中心电力系统需要提供干净的电力供应,以避免对设备造成损害。在测试验证期间,需要测试电力质量,包括测试电磁干扰、谐波失真、切换时间等指标。
  
  2.2 暖通空调系统测试
  
  1)
温度控制测试
  
  数据中心的设备需要保持在适宜的温度范围内运行,在子系统测试需要测试空调系统的温度控制性能。测试过程中需要模拟不同负载条件,检查空调系统是否能够及时调整温度并保持稳定。
  
  2)
湿度控制测试
  
  数据中心的设备还需要保持在适宜的湿度范围内运行,因此需要测试空调系统的湿度控制性能。测试过程中需要检查空调系统能否准确控制湿度,并避免湿度过高或过低的情况发生。
  
  3)
冷却能力测试
  
  在测试验证期间,需要测试空调系统的冷却能力。测试过程中检查空调系统送回风温湿度、风机转速、运行温度压力记录等,并避免温度过高的情况发生。
  
  4)
空气质量测试
  
  数据中心的设备需要在良好的空气质量环境下运行,需要测试空调系统的空气质量控制性能。测试过程中需要检查空调系统是否能够过滤空气中的污染物和粉尘,并保持良好的空气质量。
  
  5)
故障切换测试
  
  数据中心的空调系统需要具备故障自动切换功能,以保证设备持续运行。在测试期间需要验证空调系统的故障自动切换性能,包括测试自动切换时间和切换后的稳定性等指标。
  
  通过这些测试,可以确保数据中心的空调系统能够稳定地运行,并在高温、高湿度等情况下提供足够的冷却能力。同时,测试还可以发现空调系统中存在的问题,并及时采取措施进行修复,提高数据中心的可靠性和稳定性。
  
  
三、数据中心基础设施联合调试
  
  通过设备单体和子系统测试后,局部系统已经就绪,因为数据中心的基础设施包括电力、空调、监控等多个系统,这些系统需要协同工作才能保证整个数据中心的正常运行,所以我们需要通过联合调试的方法,确保各个系统之间的协同工作正常,避免出现系统之间的冲突或者误动作。
  
  3.1 数据中心基础设施联合调试常规流程
  
  1)
确定联合调试的目的和范围
  
  确定联合调试的具体目标,涉及哪些基础设施和系统。
  
  2)
编写联合调试方案
  
  制定详细的联合调试方案,包括测试场景、测试方法、测试人员、测试时间和测试设备等。方案是测试的依据,只有具备可操作性的方法和方案才能验证出设备/系统的功能和单点故障。在此阶段,测试方根据设备招标文件和设计图纸完成主要的联合调试方案工作和其它相关的文档,方案制作完成后提交用户方、设计单位、总包、设备厂商进行讨论,然后更新,最终形成各方达到一致的方案。
  
  3)
确定测试环境
  
  搭建测试环境,包括模拟负荷设备、气流组织通道、电气链路拓扑等,确保测试环境和实际生产环境尽可能相似。
  
  4)
进行测试
  
  按照联合调试计划执行测试,模拟实际操作场景(冗余测试、灾备测试等),还包括供电设备、机房温湿度、信号传输等方面的测试。
  
  5)
收集数据和分析
  
  对测试过程中产生的数据进行收集和分析,包括错误信息、性能数据、日志等。
  
  6)
修复问题和优化
  
  根据收集的数据分析测试结果,修复发现的问题,优化系统性能和稳定性。
  
  7)
再次测试和确认
  
  进行销项复测,确认之前修复的问题是否已经解决,系统是否已经优化稳定。
  
  8)
验收和验证
  
  验收联合调试结果,验证系统是否已经满足用户需求和设计要求。
  
  以上是数据中心联合调试一般的步骤,具体操作可能会根据实际情况有所不同。
  
  3.2 联合调试需要重点关注的问题
  

  数据中心基础设施联合调试是一个涉及多个系统、复杂度较高的过程,其中的重点包括以下几个方面:
  
  1)
多系统协同问题
  
  数据中心的基础设施包括电力、空调、机柜、网络等多个系统,这些系统需要协同工作才能保证整个数据中心的正常运转。在联合调试中,需要确保各个系统之间的协同工作正常,避免出现系统之间的冲突或者误操作,如高低压逻辑、BA系统等。

  
  2)
安全问题

  
  数据中心是存储重要数据的场所,安全问题是必须考虑的重点之一。在联合调试过程中,需要注意数据中心的物理安全和人身安全问题,并严格遵守安全规范和流程,确保数据中心的安全性。
  
  3)
故障处理问题
  
  联合调试过程中,可能会出现各种故障,需要及时处理和解决。对于一些难以处理的故障,需要及时联系相关厂家或供应商寻求技术支持。
  
  4)
负载测试问题
  
  为了确保数据中心的性能满足需求,需要进行负载测试,模拟不同负载情况下的运行情况,以验证数据中心是否能够正常工作。负载测试需要涉及到多个系统,需要确保测试过程中的负载参数合理,以及测试数据的真实性和准确性。
  
  5)
可靠性问题
  
  数据中心是一个高可靠性的场所,需要确保设备的可靠性和稳定性。在联合调试过程中,需要对设备进行全面的测试和验证,以确保设备的可靠性和稳定性符合要求。
  
  综上所述,数据中心基础设施测试验证是确保数据中心稳定运行、验证建设服务质量的重要步骤。秉承以终为始的理念,通过对数据中心基础设施进行全面测试,可以发现问题并及时解决,从而让数据中心在各种正常或极端情况下均能持续运营。
  

  参考文献
[1] 《GB50174-2017数据中心设计规范》  
[2] 《GB50462-2015数据中心基础设施施工及验收规范》  
[3] 《Data Center Site lnfrastructure Tier Standard:Operational Sustainability数据中心站点内部结构Tier标准:运营可持续性》(Uptime Institute)

  作者简介:

 

      王少飞,高级工程师,全国电源与新能源行业专家,Uptime Institute认证Tier专家(ATS),PMI项目管理专业人士(PMP),长期从事电气设计、工业自动控制、防雷工程、UPS电源系统等行业,熟悉中大型工程设计、预算审核、项目管理等工作。

 

作者:中科仙络智算科技股份有限公司  王少飞   
来源:《数据中心建设+》杂志
 
 

 

 

中科仙络

 

中科仙络,数据中心场地设施技术咨询与专业服务公司,拥有中国合格评定国家认可委员会(CNAS )的认可证书,既是中国质量认证中心CQC委托检测实验室,也是中国计量科学研究院指定数据中心认证检测机构。

 

自有从事数据中心验证的专业团队,多名工程师均通过Uptime ATD或ATS全球认证,自有完整的数据中心检测体系及解决方案,自有完备的检测设备及工具,保障检测结果的准确性。自有的“网红”数据中心液冷测试验证技术,液冷假负载已取得发明和实用新型两项专利。

 

经过10多年检测实施经验积累、数百个验证项目打磨,目前已成为金融机构、电信运营商、互联网头部企业、第三方IDC、政企认可的第三方检测单位。

 

咨询热线:400-161-1386

 

 

2023年7月17日
浏览量:0
收藏

相关新闻