提升自动化运维值班工作效率的方法

(整期优先)网络出版时间:2016-02-12
/ 2

提升自动化运维值班工作效率的方法

杜鹏李耐心王伟田新成冯良韬张兆鑫杨广兴

(国网冀北电力有限公司唐山供电公司河北唐山063000)

摘要:本文主要对自动化运维值班工作进行研究,针对自动化运维值班工作的人员少、任务重、责任大的特点,从技术、管理、标准化作业等方面对各个环节进行了优化,制定了多项规定、标准、流程,将调度自动化运维值班工作标准化、流程化、快速化、痕迹化。确保在自动化值班员在值班期间以最少人员、最高效率、最高质量完成各项工作任务,提高了自动化运维值班工作效率。

关键字:自动化运维值班工作效率方法

一、背景

“三集五大”改革以来,调控中心适应“大运行”改革新模式,将主配农网各项工作充分融合,工作范围与工作强度大大增加。从自动化值班工作角度来讲,自动化值班员原来只运行维护一套调度自动化系统,一座不到40平米的自动化机房,而目前公司调控中心共运行7大类系统,系统接入了唐山地域范围10-500千伏全部厂站。自动化值班员负责巡视机房4座,机房面积总加达500余平米,机房运行设备共计300余台。值班期间需负责给地调调度、地调监控、配网调度多个专业部门做技术支持。调度自动化系统是一个安全性、可靠性要求较高的系统,任何一个设备出现故障,都可能造成公司发生6级安全事件。然而自动化值班员一天工作任务繁重,如果按照原来的值班模式与值班方法远远不能适应目前的工作强度,在这样一个高标准、高要求的工作环境中,不仅要求自动化值班员自身素质过硬,更需要一套完善的值班制度,高标准的值班流程,需要有一套便捷的巡视平台做技术支撑。

二、自动化运维值班工作量

目前,公司调控中心共运行调控一体化系统、地县一体化系统、配电自动化系统、调度数字证书系统、内网安全监测平台系统、OMS系统、机房环控系统共计7大系统。自动化值班员一天需要做如下工作:

1、运行值班人员的岗位在计算机值班室,值班人员应集中精力坚守岗位,不得擅离职守,自动化值班员一天应巡视4座机房、7大系统。

2、认真执行《运行值班交接班制度》,每日三次对机房进行巡视。检查各服务器、工作站运行情况,机房温湿度、负荷曲线、正常监视画面是否正常,发现故障应及时处理,并对故障现象、当时环境及处理情况作好记录,当故障不能处理时,应及时通知有关专责人进行处理,并视情况向所汇报。

3、值班员应通过各应用系统画面,来监视各个系统的运行工况,比如:服务器负载、网路状态、应用工况、进程工况、通道工况、负荷缺陷、状态估计、调度潮流、负荷预测等。

4、按要求认真填写值班日志,包括各服务器、工作站运行情况,机房温湿度是否正常;

5、值班人员要按规定进行通道运行状况等有关内容的检查工作,并填写记录表单,对处于异常、故障状况的通道分别予以记录并处理。

6、保持机房和设备的整洁,机房温度应保持在18-24度之间,温度应在40%-70%之间。当班期间应对值班室、走廊和生活间进行清扫。严格执行《机房安全保卫制度》和《机房安全防火制度》

7、为地区调度、地区监控、配网调度、站端处缺人员做相关技术支持与问题反馈工作。

三、值班工作存在的主要问题

按原有的自动化值班模式,通过以前老的方式方法继续进行巡检值班由于自动化机房设备和应用系统的爆炸式增加,会导致工作量剧增,同时没有规范的流程知道和相应的规程会导致巡视结果产生误差,另外普通工作日也需要值班员进行值班通常与值班员的本职工作相冲突,老的值班方式已经严重影响到值班的效率,从而导致对电网正常安全运行的潜在威胁。目前自动化运维值班工作存在的主要问题:

值班员对值班工作的流程不明确;

系统众多、模块众多,值班员无法快速巡检排查处理问题;

日志信息不全无法包含所有重要的系统和设备。

四、提升值班工作效率的方法

1、值班员明确值班工作流程

制定值班工作流程,明确值班员工作职责。兼职值班管理员负责对自动化运维值班员的工作监督检查,检查并审核自动化值班日志、检查自动化软硬件维护单、检查系统检查记录、机房出入记录、自动化值班日志记录,值班缺陷上报及处理记录,提出相应安全监督工作意见和建议,并对发现的问题进行跟踪、技术指导及督促整改。专职值班员负责对调度自动化系统各工作站、服务器、网络设备、各应用软件模块,机房空调、动力环境系统的运行状态检查、分析、记录,并对值班发现的异常、缺陷及时上报、处理,按时填写机房出入记录、软硬件检查记录、值班巡视日志等相关内容,按照兼职值班管理员的批复结果对值班记录确认留存及选择发布,并执行交、接班流程。

2、通过技术手段对系统进行监视

调控一体化系统系统其运行稳定性非常重要,所以要对前置通道、系统应用状态、设备状态、遥测转发等重要信息进行采集监控。根据实际情况开发制作了基于OPEN3000系统的综合监视界面,调度自动化系统“一站式”综合监视图,分别对系统和设备的重要信息进行监视采集。

对于机房设备,增加机房环境监控界面,修订设备监视日志内容和值班日志检测内容来应对设备增加带来的变化。

3、制定系统巡检巡视模板

根据内容的重要性区分,对系统的应用、电网的负荷、向省公司的转发情况以及状态估计的计算情况等比较重要信息进行采集,制定并完善了最新的自动化值班记录,以确保重要信息的准确记录。同时对于机房设备的巡检内容也进行了分类细化工作,并制定了相关的机房设备巡检模板。

五、改进效果

1、大大降低值班员巡检机房查看系统运行状况的时间。

通过对各个系统和设备运行状况的集中化监控界面的制作,使得值班人员可以在半小时内完成所有系统运行状况和设备运行状况的检测,比以往的巡检时间缩短了一倍以上。值班员可以更多次的检测设备和系统的运行情况,更快速的发现出线故障的设备。

2、大大降低了突发问题的处理时间。

通常值班日是值班员要处理来自站端、主站、以及上级单位值班员提供或反馈的问题,由于涉及问题范围广泛导致部分问题处理值班员不熟悉,通过流程改进和技术文档的总结归档现在值班员处理问题的相应时间一般控制在20分钟之内,个别问题可以实现当场处理,大大提高了问题的相应效率。

3、及时的发现设备和系统的故障,提高了电网运行的安全率。

由于采用了新的集中式系统运行和机房设备监控界面,从而能记起快速的发现系统和机房出现的故障并第一时间解决,保证了空调和机房设备的正常运行,从而确保了电网的安全稳定运行。

作者简介

杜鹏,男,工程师,高级技师,从事调控一体化运维工作。

李耐心,男,高级工程师,从事电力调度管理工作。

王伟,男,工程师,从事电力二次检修工作。

田新成,男,高级工程师,高级技师,从事调控一体化运维管理。