(宿迁市供电公司江苏宿迁223800)
摘要:随着互联网业务的爆发式发展,运营商的IP承载网规模也不断扩大,网络结构越来越复杂,单设备容量也日趋庞大,相应的网络安全问题也日益突出,网络安全日常维护工作已经成为运营商运维部门普遍关注和不堪重负的问题。为了适应市场发展的需求,中国电信实施了维护集约化的策略,力图改变原先维护力量分散、市场支撑响应慢的问题。
关键词:网络安全;自动化;运维;分析
1导言
集约化的根本目的是为了优化资源配置,提高网络运维的效率,从而提升企业的运维水平和竞争力,但维护集约化并不是简单地把人员和工作量进行集中,更重要的是要提升运维管理。
2网络运维管理需求分析
网络运维管理是对网络日常运行进行实时监控与维护,保证企业网络的稳定运转与畅通,保障各项业务及其相关信息系统的正常运行,是企业办公的必备要素与基础建设。由于网络运维管理具有全天候运行、不可逆作业、高风险集中等特性,这使得网络运维管理必需向智能化的运行模式迈进,建立流程化和信息化的运维管理系统,实现运维业务的集成化、规范化与自动化运作,既体现了现代化企业管理的强烈需求,又推动了网络运维的高效管理。
图1网络运维管理核心功能
如图1所示,网络运维管理工作主要包括以下核心功能:一是性能管理,性能管理是指对企业内部网络及其相关设备进行状态监控、性能检测以及故障发现的管理功能,是网络运维管理的核心功能。例如,网络运行性能、质量控制性能、带宽占用性能等网络指标;二是故障管理,故障管理是对网络运行中的异常与引起网络系统非正常运行的相关因素进行纠错处理,使网络能够迅速恢复至正常状态的管理功能;三是资源管理,资源管理是指对网络资源进行分配与利用的管理功能,此处的网络资源包括网络地址空间、网络宽带、网络设备等软硬件资源。例如,根据业务对资源的需求,对企业的核心交换机、核心路由器、网络防火墙、专线网络带宽与互联网网络带宽等资源进行参数设置,实现资源的按需分配;四是变更管理,变更管理是指对网络配置进行改变与更新的管理功能,包括网络硬件设备的变更、网络软件系统的变更、网络管理系统的变更等;五是配置管理,配置管理是指对网络运行参数及相关设置的管理功能,包括网络用户角色设置、网络运维参数设置等;六是日志管理,日志管理是指对网络运行状态及用户操作信息的存储、检索等管理功能,确保网络运维管理实现各项操作的可追踪与可溯源。
3自动化网络常见的安全问题
3.1网络病毒的传播与感染
随着计算机和网络的进步和普及,计算机病毒也不断出现,总数已难以计数,并以极快的速度增加,其破环性也不断增加,而网络病毒破坏性就更强。一旦文件服务器的硬盘被病毒感染,就可能造成系统损坏、数据丢失,使网络服务器无法起动,应用程序和数据无法正确使用,甚至导致整个网络瘫痪,造成不可估量的损失。网络病毒普遍具有较强的再生机制,可以通过网络扩散与传染。一旦某个公用程序染了毒,那么病毒将很快在整个网络上传播,感染其它的程序。由网络病毒造成网络瘫痪的损失是难以估计的。一旦网络服务器被感染,其解毒所需的时间将是单机的几十倍以上。
3.2黑客网络技术的入侵
目前的自动化网络基本上都采用以广播为技术基础的以太网。在同一以太网中,任何两个节点之间的通信数据包,不仅可以为这两个节点的网卡所接收,也同时能够为处在同一以太网上的任何一个节点的网卡所截取。另外,为了工作方便,自动化网络都备有与外网和国际互联网相互连接的出人口,因此,外网及国际互联网中的黑客只要侵人自动化网络中的任意节点进行侦听,就可以捕获发生在这个以太网上的所有数据包,对其进行解包分析,从而窃取关键信息;而本网络中的黑客则有可能非常方便的截取任何数据包,从而造成信息的失窃。
4运维工作分析
4.1日常维护
网络安全日常维护是网络安全维护工作中的重中之重,在安全维护人员的全部工作中占据重要位置。日常维护本应该是网络维护人员的核心工作,但在日常故障、工程等工作的压力下,维护人员往往把网络优化放在事务性工作之后,在有空的时候才做。这样的结果是导致网络中的隐患日积月累,形成恶性循环,加大了运维工作的难度。另一方面,日常维护本身也是非常繁琐的工作,开展起来有相当的难度,这也是运维人员不愿意花很多精力在这里的原因。日常的安全扫描和设备巡检是发现网络隐患的主要方法,巡检内容包括安全扫描、配置规范、设备状态、日志审计等,目前浙江电信已经通过SOC平台实现了设备日志分析和安全扫描的定期执行,但仍需要维护人员手工检查巡检结果,并实施相应的处置。由于这些巡检工作有很多都是通过脚本执行的,所以可以通过建设一个统一的管控平台实现配置规范检查、日志审计等工作的自动化,并且通过将巡检结果输出到运维管理平台,可以实现对巡检结果的闭环管理,同时也可以通过一些自动化处置工具实现巡检结果的自动下发处置。
4.2事件处理
目前,网络安全事件的来源主要包括网管监控发现和上级部门下发,针对事件的主要处理方式就是形成工单派送给相应的岗位进行人工处理。维护岗位的人员需要手工登录相关系统进行检查,找到事件相关IP地址的属性,然后采取合适的手段进行处置。事件处理要实现自动化首先要做好规范化,其次是设计好每个事件的处理流程和方法。对于SOC平台告警需要进行二次处理,分析出告警的原因和准确位置,对于一部分简单的告警实现处理脚本的自动下发。比如监测到设备的SSH登录暴力破解告警,我们可以分析出准确的故障位置,即时下发工单派送维护岗位进行处置。SOC平台产生的这部分告警完全可以实现全自动运维,不需要人工介入。对于上级部门派发的事件,通过整理好各类事件的处置规范,同时通过建设事件处置辅助系统,实现标准化事件的快速处置。
4.3工程和配置变更
在一个工程建设过程中,会涉及到多台设备的配置和割接,牵扯了维护人员的大量精力。设备上线前的网络安全配置规范检查是工程验收中的主要工作之一,我们可以通过将现有的文档规范转变成可以自动检查、自动下发的脚本,实现这些工作的自动化。而工程和割接后,相应资源管理系统、网管系统的资料变更也是一项重要工作,如果这些系统提供相应的接口,自动化运维平台就可以调用接口实现资料变更的自动化。另外割接本身涉及大量的管理流程,需要经过多个审批步骤,比如期间分公司运维人员和设备厂家维护人员均需要承担相应的工作,这就涉及到在运维认证平台上面开放临时权限,这就涉及到如何通过接口实现权限的开放和回收。通过自动化运维的手段,可以整合各个管理和网管系统,很大程度减少运维人员的工作量。
5结论
自动化运维是指通过将IP网络运维中日常的、大量的重复性工作自动化,把过去手工执行转为自动化操作。实现运维自动化可以极大地提高运维效率,提升市场响应速度,提高网络运行的稳定性,是网络运维的最高层次,也是未来的发展趋势。
参考文献:
[1]菅晓清.变电站自动化系统一体化解决方案设计[J/OL].内蒙古电力技术,:1-5(2017-10-26)
[2]王英凯.计算机网络办公自动化及安全策略探究[J].化工设计通讯,2016,42(01):66+69.
[3]李耿.有关电力调度自动化的网络安全问题思考[J].科技与企业,2012,(20):57.
[4]郑海坤.关于电力自动化系统网络安全的几点思考[J].机电信息,2012,(03):147-148.
[5]丁美荣,魏海亮.基于B/S和C/S混合模式的办公自动化系统的网络安全策略研究[J].计算机与现代化,2011,(06):190-192.