上海德衡数据科技有限公司上海市200126
摘要:目前,随着“互联网+时代”的到来,社会数据量呈现爆炸式的增长,各行各业对数据中心业务的需求已经提上日程,同时对数据中心资源管理提出了更高的要求。数据中心是支撑物联网、人工智能、产业数据化重要基础设施之一。如何消化现有实际存量的数据中心资源,并且合理规划使用新增资源,已成为每个数据中心运营开发商所面临的问题。现阶段我国数据中心产业将面临着数字化、产业化、智能化、能源化的高度发展趋势。鉴于此,本文主要分析数据中心基础设施管理系统的研究与设计。
关键词:数据中心;基础设施;管理系统
DCIM(DataCenterInfrastructureManagement,数据中心基础设施管理平台是利用软件、硬件和传感器等设备将IT和设备管理结合,来对数据中心基础设施进行集中监控和管理,从而建构基础设施与IT设备的有机融合。数据中心是支撑物联网、人工智能、产业数据化重要基础设施之一。如何消化现有实际存量的数据中心资源,并且合理规划使用新增资源,已成为每个数据中心运营开发商所面临的问题。现阶段我国数据中心产业将面临着数字化、产业化、智能化、能源化的高度发展趋势。在现有的趋势下,数据中心必须通过DCIM的有效平台,对整体数据中心进行合理化管理与运营,才可以将数据中心实现可持续化发展。
1、基础设施管理系统开发的背景
根据CA和IDC推出的联合报告来看,84%的基础设施皆面临容量管控、能源消耗、可视化管理和托管等领域的难题,而这些难题开始成为导致数据中心高成本运维性的主要关键点。基础设施的高成本运维,将会影响数据中心投资管理方的整体运维成本,降低投资回报率。由此可见,除了在技术上改变基础设施维保的管理和维护以外,也必须将数字化、智能化的运维手段结合到实际管理应用当中,才可以逐渐实现数据中心整体运营成本的降低。对于数据中心运营团队来说,如何将基础设施运营成本逐步合理化,控制基础设施运营时的方式方法,将成为数据中心收益把控的核心关键点。
在国外的大多数数据中心和我们国家早期建设的楼宇型数据机房当中,大多数采用的是BAS(BuildingAutomationSystem)来实现整个数据中心的物理环境监测功能。该功能内一般结合常用的暖通系统、智能化系统、安保系统等。但是该系统已经不满足现有数据中心的发展和使用需求。国内早期的大型数据中心采用的是动环监控系统。动环监控系统是采用大量数据采集、传输和整合的形式,对整个数据中心的基础设施进行远程监视和远程调控。DCIM与动环系统在关键设备的监控上有很大的相似性,都具有对主要设备的监控与关键子系统的调配控制。但是原有的动环系统只是起到单一的基础设施的管理作用,而没有与运营管理相结合,而为了补充了这个缺失的部分,DCIM的开发与实施将整个数据中心的运营管理结合在平台内,充分实现了更高效的管理体系。
2、DCIM的技术优势
传统的数据中心运维管理模式采用的是被动式的告警管理模式。当基础设施发生故障时,监控模块将通过多方位的故障告警形式,将故障通知给运维管理人员。而运维管理人员除了通过日常巡检与平台告警的形式管理基础设施外,并无更高效的管理手段。正是因为如此,大量的设备运维通多重复的、多人工的形式进行管理,运营管理成本极其高昂。增加了项目整体的投资回报率。
而采用了DCIM平台的数据中心,一方面可以进行主动化的自主分析形式,将故障点实现前期预判,另一方面可以简化运营流程,同时还可以实现基础设施的能耗管理,减轻了运维管理人员的负担,降低了整体的运营成本。
2.1、将设施运维化“被动”为“主动”
现有数据中心的管理难题是,无法将现有的资源实现可视化。包括整体楼层的布局分布、配电、暖通、机位等主要资源,在原有的环境管理软件上无法实现可视化,从而无法实现合理的管理与资源分布。而DCIM平台,可以将现有的资源实现整合、梳理和呈现,并且可以将潜在的危机分析给运维管理人员。使其实现预先预防,预先管控。
2.2、IT设备和基础设施实现统一管理
现在的数据中心的建设已经呈现出高密度、高可靠性、高标准、快速部署的特点,根据使用客户不同的业务需求,数据中心的定制化也成为基础建设与维保的关键因素。虽然数据中心的建立具有一定的差异性,但是对于IT设备、基础设施的管理方面具有一定的统一性。DCIM的整体框架,始终将基础设施运维与人员管理相结合。在一定程度上降低了管理与流程的简化性,并将基础设计与IT设备的运维紧密结合,管理设备的同时也进行人员管理。将整个管理的组织架构进行层层嵌套,并将各子系统进行明确的子系统划分。通过集中管控与集中管理的紧密结合,将数据中心全生命周期的管理实现以业务和服务为最终导向的目标。
2.3、有助于消除数据中心运行风险
原有数据中心的管理系统采用的是故障监控与故障告警形式,无论是在设备的维护上,还是在人员的管控上,都造成了一种被动管理的形式。增大的数据中心运维的风险。而数据中心最重要的就是安全可靠性。DCIM的精细化管理,可以对基础设施的健康状况进行预估和预判。通过数据采集、整理、比对、分析,可以将整个数据中心的故障点预先告知,让运营和运维人员可以进行有效的风险评估和风险防范,为自身和客户的数据中心安全提供了更可靠的保障,同时也降低了设备宕机带来的经济损失。
3、数据中心基础设施管理系统的设计
3.1、容量管理
在数据中心建立之后,数据中心的物理空间、电力能源、冷量、机柜容量、网络资源等,均呈现逐步增长状态。而运营人员在运营整个数据中心的过程当中,必须将这些数据时刻知悉、时刻调用,并不断完善,才可以将整个数据中心的资源支配与资产管理实现可持续化发展。DCIM的容量管理可实现数据的自动更新,为运营人员提供了强大的工具。
3.2、能耗管理
数据中心是大型的能源消耗平台,对于煤炭、电力、供水、甚至与天然气等能源均需要持续性的大量消耗。如何将基础设施的能耗降低,使更多的能源可以分配利用在IT设备上,是所有数据中心的持续关注点。DCIM可以内置智能化的能源管理软件,将能源消耗进行分析比对,并可以将其生成报表提供给运营管理人员。使管理人员可以及时调整能源分配,进行合理化的节能手段进行管制。在降低能耗的同时,实现对运营成本的有效管控。
3.3、运维管理
对数据中心的所有工作进行规范化、流程化、标准化信息化、自动化管理。运维管理基于GB/T33136、ISO、ITIL、UptimeM&O等一系列国内外标准参考,需要建立一个规范化的管理体系。而DCIM可以内置标准化流程、分析报表、绩效考核、服务平台、事件管理等一些列运营管理模型。可以通过线上的流程化工单,结合运营平台和移动设备,对运营人员起到系统化管理和考核的作用。同时内置一系列标准化操作流程,降低运维人员的操作难度,同时内置大量的知识库,可对运维人员进行培训,提高其效率。
3.4、变更管理
随着数据中心业务的发展和需求,IT资源和技术设施资源将会随着业务类型的改变而调整。DCIM平台可以内置变更流程,可根据业主的发展需求自定义其变更管控形式。将关键设施的变更、IT设施的变更和人员管理的变更综合在该流程内。可实现在线模拟,降低变更时出现的隐患。从而实现时间和成本的严格把控。
3.5、资产管理
数据中心的超大规模建立,意味着运营人员所要管理的IT资源也是数量庞大的。虽然数据中心的规模体量级客观,但是其管理必须精细化到微量级的机柜U位级别。DCIM的资产管理软件,将通过预先内置的机柜管理条、核心设备的管理地址码、信息传输点位等,将IT机柜的所有具体信息整合至平台当中。使数据中心管理人员清晰的了解资产的使用状况,并可以结合上下架原因,进行可视化的管理与调配,将柜位资源合理化利用调整。
总之,未来,塑造绿色、有核心竞争力的数据中心是市场规律之下的趋势,将数据中心的运营通过数字化的管理与整个数据中心的生命周期结合。如何运用智能化的管理平台与先进的管理手段,将国家与企业的数据化发展和数据化需求相结合,为经济发展提供可靠的保障,是所有数据中心从业人员的重中之重。而该系统的发展,也将随着从业人员的不断深入,规模的发展和客户的需求而日趋完善。据此,本文对于专业化的设施管理系统的研究起到抛砖引玉的作用。
参考文献:
[1]陈文环.一种数据中心基础设施综合管理系统的设计与实现[D].浙江工业大学,2017.
[2]潘宗霞.一种大型数据中心基础设施综合管理系统的设计与实现[J].机电工程技术,2014,43(07):77-80.
[3]吴甘星.数据中心设施服务的发展概述[J].金融科技时代,2018(05):28-30.
[4]谭雄华.数据中心基础设施管理系统在电力行业的应用[J].信息与电脑(理论版),2016(15):120-122.
[5]李明江,朱宇琛.数据中心基础设施管理平台在国内的发展[J].电信技术,2014(08):52-54.
[6].美国康普iTRACSDCIM——打造新一代数据中心基础设施管理的ERP平台[J].智能建筑,2014(01):37.
[7]孙慧永.为数据中心量身定制智能基础设施管理系统[J].智能建筑与城市信息,2012(11):48-52.
[8]郭嘉凯.数据中心基础设施管理走向一体化[J].软件和信息服务,2012(08):68-69.