地址:北京市密云区高岭镇政府办公楼
王经理 13393261468
Q Q:514468705/1049705527
邮箱:jhcxkj@163.com
④消防系统
数据中心如果发生火灾,会毁坏计算机设备,中断正常的系统运行,甚至危及工作人员的生命,所以消防系统非常重要。对于消防系统的测试验证工作主要就是检查报警系统、灭火系统、排烟系统是否能够在早期发现火灾隐患,准确及时报警,在火灾发生后快速灭火,并将有害气体排出。有关消防系统的测试验证主要工作内容见表4。
⑤装饰装修系统
数据中心基础设施为用户的业务需求提供支撑,同时它也是一个建筑主体,需要满足设备、人员对装饰装修方面的相关要求。装饰装修系统的测试验证工作主要是对地板、吊顶、门窗、墙体等是否符合规范的检查。有关装饰装修系统的测试验证主要工作内容见表5。
⑥故障模拟
故障模拟测试是借助假负载营造数据中心上线后的实际运行情况,然后模拟机房运行中可能出现的故障,来验证各系统在出现故障情况下的反应是否符合设计预期,从而判断机房的抗故障能力和设计等级。故障模拟测试不但是验证机房实际运行能力的重要手段,也为运维团队提供应对紧急状况的实践经验,运维人员应该在故障模拟测试过程中了解系统的薄弱环节、总结有可能出现的故障特征、制定最佳应对流程,才能在以后的运维工作中遇到故障不慌乱,及时准确地采取措施,将故障对系统运行的影响降到最低。有关故障模拟的测试验证主要工作内容见表6。
以上按照验证对象来划分的测试验证工作并不能覆盖所有内容,针对项目做具体的方案时还应该考虑设计图纸、设备配置、客户需求等因素来增减条目,才能真正符合验证系统是否满足运行要求的目标。
4 常见问题及案例分享
(1) 测试验证中出现的常见问题
在测试验证过程中,一些设备性能、系统联动方面的问题就暴露出来,这也正是我们做测试验证工作的目的。如果这些问题不及时发现,进行整改,机房上线后就可能出现无法弥补的损失。按照验证对象分类角度,列举相关系统测试验证中出现的常见问题及其危害,分别见表7至表11。
(2) 案例介绍
北京某大型IDC数据中心,总建筑面积25552.51m2,地下1层,地上2层,建筑高度(最高处)19.9m,是原有建筑改造工程。该项目共分三期进行,以二期的第一阶段为例,测试验证工作共涉及4个机房,766个机柜。
测试验证团队针对电气系统、空调系统、智能建筑系统、消防系统、装饰装修系统进行了测试验证工作,共完成77大类测试项目,实时记录4809个数据,其中4400个数据在正常范围内,409个数据偏离正常值。经过对非正常数据的分析,总结出19个问题,主要包括:UPS室空调气流短路,无法有效地给UPS散热;UPS室上面线槽距离UPS太近,UPS散热效果不好;4个机房均为负压,机房密闭性差;PMS、BMS无法正常显示监控数据,仍需继续进行调试;变压器失电后,PMS系统中UPS上口配电柜没有声光报警;机柜运行参数中通讯故障,监控室无数据显示:CCTV系统摄像头编号未编写,软件中无法看到是在什么房间什么位置;CCTV软件中无地图,无法判定是什么位置的摄像头;门禁系统软件地图个别地方与实际不符,需要重新调整,需要添加房间编号;门禁系统延迟时间太长,门状态改变之后至少需要1.5min之后,软件中的状态方能改变;温湿度监控系统现场没有标签,误差值较大;干接点测试中变压器模拟故障时,干接点系统无声光报警;空调的过滤网没有进行固定。这些问题如果不在机房上线前解决,将为机房运行带来非常大的隐患,也为运维工作增加了难度。
用户在收到这些问题反馈之后,及时进行了整改,复测全部合格。目前该数据中心二期已经上线运行,运行状况良好,测试验证工作达到了预期的目标。
5 结束语
测试验证是一个确保系统设计、安装、功能测试、系统联调、运行状态与设计意图相符合的过程,是设施获得良好功能和可靠运行过程中的重要组成部分。一个好的测试验证不应仅满足“测试”相关的设备功能指标,更重要的是“验证”系统是否可以满足运行阶段的要求。运维人员也应利用测试验证的过程,熟悉未来的管理对象,验证设备操作流程的正确性,增加实际操作和应对突发事件的经验。
另外,部分用户认为测试验证工作只与新建项目有关,其实不尽然,测试验证同样也适用于扩建、改造项目和日常的维护活动。对已经运行的数据中心做测试验证,通常称为“健康评估”,就是通过仪表测量、观察、分析等方式,找出隐藏的运行隐患,确保基础设施达到功能要求,实现预期的可靠性和可用性。用户应考虑将“健康评估”作为一种常态的测试验证形式,融入到日常的操作和维护工作中。