咨询热线 400-901-1389 18614257699
新闻资讯
当前位置 当前位置:首页 > 新闻资讯 > 公司头条

《数据中心基础设施运行与维护评价技术规范》(CQC8302-2018)解读——监控管理

发布时间: 2023-12-12    作者:世华中科集团
  分享到:   
二维码分享




CQC8302解读

监控管理重要性

数据中心基础设施的监控管理是数据中心运维管理工作的一个既基础又核心的内容,因为一方面基础设施为数据中心运维提供基本的物理环境资源保障,另一方面,基础设施运行的监控数据和监控信息是其它管理能力项(:事件管理、容量管理等)的输入。因此,站在数据中心基础设施运维管理的高度,关注监控管理是非常必要的。

规范描述

数据中心应提供独立的监控调度指挥空间。针对多数据中心管理,除本地具备监控调度指挥室外,宜具有区域覆盖或总控总调监控管理团队。监控中心值守人员应为7x24小时值班制度,应根据值班管理文件,值班人员不得长时间离开监控岗位,应根据警情,通报给运维人员处置,紧急情况可协助处置。为保障监控系统功能的完整性、易用性、可靠性,要求提供针对监控系统持续优化的维护管理制度。

规范解读

1. 应能实时并连续监控基础设施的运行,监控范围应包括供配电、空调环境、安防、消防,宜包括IT设施。
2. 应具备监控对象数据采集、处理、阈值设置、阈值判断与异常告警功能。采用包括声光、文字短信、语音短信、邮件等告警方式。
3. 应具有故障级别设置功能,故障等级设置应满足不同数据中心的等级划分,并与服务等级匹配。
4监控系统应具有故障定位功能,应防止告警潮发生,且宜与事件管理关联。
5. 监控系统的容量应可弹性扩展,扩容过程不造成系统中断。
6. 安防视频监控数据存储在安全的存储介质中,保留时间宜不少于3个月;其它监控数据宜保留3年。
7. 监控系统覆盖率、准确性宜与数据中心规模、等级、组织管理成熟度相匹配。
8. 应提供趋势分析功能,能为决策提供数据支撑,并为运行维护管理提供分享数据。
9. 监控系统应具有趋势分析功能,可为决策提供数据支撑。
10. 宜提供预警数据分析,提供与运维管理工具的联动操作,包括自动化和半自动化操作的可监可控能力。

案例分享

企业简介:四川川西数据产业有限公司(以下简称“川西数据”)贯彻落实雅安市委市政府“加快形成以五大千亿产业、大数据产业为主体的‘5+1’绿色产业体系”战略,致力于汇聚和深耕大数据资产价值、影响和推动川西大数据产业发展。目前,川西数据已完成2#、3#、4#数据中心建设工作并正式投运。按照雅安市政府统一部署,由川西数据承担川西大数据产业园数据机楼建设、运维、运营等工作。

图1 川西数据产业园区4#数据中心外景

图2 川西数据产业园区4#数据中心内景
监控管理策略:川西数据与维谛技术等主流厂商联合开发的“绿色数据中心综合运营管理平台”,对前期建设中涉及的多个数据网系统如动环、BA、油机等进行了数据集成,并引入人工智能分析,在加强现网数据应用基础上进一步提升和..园区数据中心的综合监控系统。
系统架构如下:

1. 川西数据“绿色数据中心综合运营管理平台”的子系统:数据中心监控管理系统功能——包括数据集成、分析处理、存储、展示,可实时掌控2#、3#、4#数据中心的基础设施运行情况,辅助现场运维团队提升数据中心能效、资源利用率与可用性。运维人员在履行各自工作范围职责时,可更方便地了解相关专业系统运行情,有利于提高分析处理问题的时效性,提高数据中心整体可用性。
2. 4#数据中心监控系统的关键设备如数据库等均采用冗余服务器配置,对应的服务器机柜也进行了物理隔离。系统满足GB/T 51314-2018、GB/T 51409-2020以及CQC8302-2018等标准和规范中对数据中心进行监控管理的范围及相关指标要求,监控系统中任何部分的单次故障都不会影响整个系统的正常运行。
3. 采用跨平台对接方式,对BA系统(楼宇自动控制系统)、安全消防系统、门禁系统、动力监控系统、电力监控系统、视频监控系统等监控系统进行解析,完成数据的集成。
4. 数据传输将采集到的信息在系统中各个节点间进行流转,并支持多种传输策略和数据处理方式。数据流的传输采用更..的主动上报传输方式,支持应用集群部署时的负载均衡,支持网络安全设备与策略的部署。

监控管理实施:川西数据产业有限公司参照《CQC8302-2018数据中心基础设施运行与维护评价技术规范》,在维谛技术有限公司的辅导下搭建了完整的数据中心运维管理体系;该体系经过近1年的运行、调整、优化,既严格遵循CQC8302规范又能灵活满足现场运维的需求。

1. 对监控值班严格按照7*..不间断监控值守,禁止监控值班室无人值守;通过交接班、巡检、预防性维护、故障应急等流程的管理;..值守人员出入有记录,未经允许外人不得进入ECC大楼。未经上岗考核合格的人员,不得单独承担监控值班和进行监控作业,严禁饮酒后上岗、无故脱岗等事件的发生。

2. 园区内3栋数据中心的ECC监控室都单独设置,不与机楼的其他设备及装置混淆在同一空间。监控室内的各个监控子系统都满足专机专用配置,配置的计算机或服务器只为特定的系统提供计算、存储、数据处理、显示输出等功能,禁止将多个不同类型的监控系统用一套计算机或者服务器。以上3栋数据中心的ECC监控室与位于2#数据中心的ECC总控中心级联,共同组成园区监控管理系统。

3. 监控系统采用分层分布式架构形式,在每栋数据中心配置了服务器、交换机、显示屏、数据采集设备、传感器、计量仪表等装置。包括电力监控系统、空调环境监控系统、安全技术防范监控系统、消防监控系统,监控系统的操作系统、数据库管理系统、网络通信协议等均采用行业通用的建设标准。

4. 对于数据中心配置大量的环境空调系统(比如VRV和冷冻水末端空调),均具备监测和监控功能;可实现对以上设备的工作模式、状态参数进行远程控制。为适应数据中心日常管理、节能、紧急事故预案的需要,还可以根据采集到的设备状态按照预先设定的应急联动策略,进行联动控制。

5. 对电力系统运行的监控管理:实现了对主要用电回路电量及电力参数进行采集、记录、统计和分析,自动计算各种电度电量参数,包括总累加电度、总有功电度、总无功电度等,实现对空调、照明、IT负载等设备能耗分项计量及管理,达到对能效指标计算和监测功能。同时系统具备对电能质量的分析功能,可实时分析各种电力品质数据,包括电压、电流三相不平衡度,电压、电流总谐波含量等关键参数。

6. 川西数据设立的安全技术防范系统,可根据防护层次划分及防护手段,采用外围到核心的防护方式,将园区内的3栋数据中心安全技术防范划分为五层防护,涵盖了园区数据中心周围环境到机楼级、机房级的分级管理。

7. 园区内各数据中心均设置了火灾自动报警系统,并符合现行国家标准《火灾自动报警系统设计规范》GB50116和《数据中心设计规范》GB50174的有关规定并获得雅安市消防部门的正式验收。各数据中心内火灾探测器的设置满足CQC1324-2018规范中对A级机房的要求,配置的吸气式烟雾探测火灾报警系统,火灾自动报警系统均满足消防电源性质,消防值班室的消防报警和联动控制信息均能上传至ECC总控中心。


小结:

作为以收集、分类和处理监控对象信息,实时掌握运行状态,及时发现和处理运行异常为目的的监控管理,是数据中心运维管理的“眼睛”,是数据中心必须建立且有效运行的能力项。

业务咨询电话:

张志国:18614257699             


扫描二维码

获取更多精彩

世华中科集团

【全文完】

标签:

False
False
False
       


京公网安备 11010802041400号