摘要:本文首先阐述了SDH的相关技术,分析了SDH设备的功能和SDH的帧结构。运用SDH基本原理和映射过程的理论基础,探讨了解决实际维护工作中的重大疑难故障的方法。归纳和总结了SDH 光端设备在日常运行维护中所发生常见故障的处理分析过程及日常维护中的一些问题。
关键词:通信设备;SDH;维护;故障排除
1 相关技术
1.1 SDH设备的功能
SDH 是一种将复接、线路传输及交换功能融为一体,并由统一网管系统操作的综合信息传输网络。 随着信息产业的发展,通信对电力工业的发展起到越来越重要的作用,电力通信网作为国内最大的行业通信网之一,如何有效地利用 SDH技术,对促进电力工业现代化的管理有着非常重要的意义。SDH 传输体系是由终端的复用器(TM,Terminal)、分插复用设备(ADM,Advance DiskManagement System)和数字交叉连接备(DXC,Digital CrosS Connect system)以及传输媒质——光纤等组成。由这些设备构成的信道及各部分功能分解,如图 1 所示。
1.2 SDH的帧结构
SDH信号的传输模块STM-N的帧是以字节为单位的矩形块状帧结构,包含大部分净负荷区(Payload)、段开销(SOH)和管理单元指针(AU-PTR)三大部分。
信息净负荷用来传送各类信息块, 将低速信号打包的过程中加入监控开销字节——通道开销字节 (POH),POH作为净负荷的一部分和信息块一起在SDH网中传送,负责对打包的低速信号进行通道的监视和控制。
段开销是信息净负荷正常灵活传送所必须附加的,供网络运行、管理和维护使用的字节。它又分为再生段开销(RSOH)和复用段开销(MSOH),分别对相应的段层进行监控。RSOH,MSOH,POH提供了对SDH信号层层细化的监控功能。
管理单元指针是用来指示信息净负荷的第1个字节在STM-N帧内准确位置的指示符, 使低速支路信号在STM-N帧中的位置有预见性, 使SDH能够从高速信号中直接分插出低速信号。
2 SDH故障定位及排除思路
2.1SDH故障定位的思路
SDH 帧结构里定义了丰富的、包含系统告警和性能信息的开销字节,包括再生段开销、复用段开销、通道开销。借助于这些开销字节传递的告警、性能信息,使得SDH系统具有很强的在线告警和误码监测能力。因此,当SDH系统发生故障时,一般会有大量的告警事件和性能数据的产生,通过对这些信息的分析,可大致判断出所发生故障的类型和位置。故障信息的来源一般有两个渠道:①通过网管软件查询传输系统当前或历史发生的告警事件和性能数据;②通过观察设备机柜和单板的运行、告警灯的闪烁情况,了解设备当前的运行状况。
通过网管获取告警和性能信息, 进行故障定位。可以全面、详实地了解全网设备的当前或历史告警信息;也可通过机柜顶部指示灯和单板告警指示灯来获取告警信息,进行故障定位。一般告警灯常有红、黄、绿3种颜色,红色代表紧急告警及重要告警;黄色代表次要告警及一般告警;绿色代表系统正常运行。
由于网管软件可对全网传输设备的运行情况进行监控和管理,因此通过获取的故障信息是非常全面的,可以知道当前设备告警和发生时间、历史告警及告警级别、性能不好时的指针调整等。因此,当故障发生时,维护人员使用网管软件获取故障信息,可以将故障定位到较准确的程度。在实际工作中,出现故障时应先收集故障现象和网管告警信息,定位故障站点,然后利用网管和测试工具证实。用故障现象和网管信息来定位故障时,应按照从严重告警到一般告警,从线路板、时钟板告警到交叉板、支路板告警的顺序进行。
在使用网管操作时,应先采集NCP时间或Ping相关的网元,以证实网管真实有效。故障发生时,一般首先通过查看告警、性能数据,并分析业务流,初步判断故障点的范围,分清传输设备内外故障。发生的故障一般包括光缆线路故障、尾纤故障、电缆故障、单板故障、网管系统故障、电源系统故障等几类。故障定位一般应遵循"先抢通,后修复;先外部,后传输;先单站,后单板;先线路,后支路;先高级,后低级"的原则。
2.2 SDH故障排除的思路
在日常维护中,故障排除的方法主要有打环法、仪表测试法、替换法和配置数据分析法等。一名优秀的维护人员必须准确掌握SDH的原理,搞清各种告警产生的机理、相应的回传信号以及对下游的影响,同时须具备良好的心理素质和丰富的工作经验,熟练掌握故障定位的常用方法,在故障处理过程中沉着冷静,避免误操作。
当发现故障时,要以尽快恢复业务为原则,通过网管告警和设备单板告警信息初步判断故障发生的原因。首先排除外部的可能因素,如断纤、尾纤与设备接触不良、交换侧故障,可以使用各种仪表,如误码仪、光功率计、光时域反射仪、SDH分析仪等来检查传输故障。例如:用光功率计测试线路衰耗,2 M 误码仪测试业务通断、误码;用万用表测试供电电压,检查电压过高或过低问题;首先应处理高级别的告警,如危急告警、主要告警;然后再处理低级别告警,如次要告警和一般告警。如果是设备告警可通过环回法将故障定位到单站,环回法是SDH传输设备定位故障最常用、最有效的一种方法。
进行环回操作时,首先应进行环回业务通道采样,即从多个有故障的站点中选择其中的1个,从所选站点的多个有问题的业务通道中选择其中1个业务通道, 然后画出所采样业务方向的路径图,图中要标出该业务的源和宿及所经过的站点、所占用的VC-4通道和时隙等,最后逐段环回,定位故障站点及单板。当故障点确定后,可以结合替换法排除故障,使用工作正常的物体去替换工作不正常的物体,从而达到定位故障、排除故障的目的。如问题仍未解决,可以采用查询、分析设备当前的配置数据, 例如时隙配置、复用段的节点参数、线路板和支路板通道的环回设置、支路通道保护属性等,分析以上的配置数据是否正常,来排除故障。若配置的数据有错误,重新配置数据并下发以恢复业务。3SDH设备故障排除实例
1)故障实例1.值班人员发现 220 kV 变环网的中心站网元呈现红色告警、其他 6 个网元呈现橙色告警。网管系统告警信息显示中心站 R-LOS告警,其他6个站 R-LOF告警。接到报告后,首先查看中心站设备,发现机柜和各单板并无告警显示,初步可以排除设备单板故障。R-LOS告警是接收端数据信号丢失,一般是光纤断或光路衰耗过大引起的。R-LOF告警是在接收端检测到定帧字节A1≠f6H、A2≠28H,说明接收端帧同步丢失,一般由R-LOS告警引起。SDH设备是通过A1,A2字节来识别帧的起始位置, 当接收端连续5 帧以上收不到正确的A1,A2字节时,接收端进入帧失步状态,产生帧失步告警(LOF),若LOF持续3 ms则进入帧丢失状态,此时将向下游下插AIS(告警指示信号),整个业务将中断。于是整个环网全部网元呈现告警可能是由于个别网元故障引起,根据显示的不同程度告警,将故障点定位到中心站网元。
根据先外部后内部的原则,首先查看从SDH设备到光纤配线架的尾纤是否有折叠而导致光衰增大, 检查无误后又查看尾纤与配线架法兰口的接口。确认外部线缆正常后,将故障点锁定在光接口板光纤接口上,将尾纤取出用酒精清洗擦干后重新插入,网管上各个网元告警逐步消失。
在本案例中,从发现告警到排除故障仅用了2min,但遵循了"先外部,后传输;先单站,后单板;先线路,后支路;先高级,后低级"的原则。从这个实例中明白了保持光纤接口清洁的重要性,光纤连续拔插最多5次后必须清洁,光纤端面碰到手等物体以后必须立即清洁。光接口板光纤接口和尾纤接头的处理不论光板和尾纤是否在使用,光板的光纤接口、尾纤的接头一定要用光帽盖住。
2)故障实例2.近期,某网管PC机的网络连接状态偶尔会出现周期性的时断时连,经过一段时间后连接恢复正常。经查看,此网管PC机通过网络交换机与监控网元间接相连,以前网络连接一直正常。采用替换法,首先将连接网管PC机的网线在交换机上更换1个确认无故障的端口,故障问题仍然存在,然后查看网管PC机,发现网卡工作正常,系统也无病毒,这样故障点就排除了两端的终端设备,故障存在于网线上,查看网线两端水晶头,发现网线直接按照蓝、橙、绿、棕排列,将网线两端水晶头重新按照直连线颜色规则,网络连接正常,故障排除。虽然目前网络设备都具有自适应功能, 但是如果网线距离太长或受电磁干扰过大会影响正常通信。双绞线由8根不同颜色的线分成4对绞合在一起,尽可能减少电磁辐射与外部电磁干扰的影响,所以制作水晶头时应严格按照电气标准。
4 结束语
本文对SDH光端设备在日常运行维护中所发生的常见故障的处理分析过程及日常维护中的一些问题进行了归纳和总结。为SDH设备维护提供了参考。由于SDH光传输系统组网方式的复杂性,加大了维护人员的工作量和故障定位及处理的难度,这就要求维护人员不断提高自身的业务水平和处理故障的能力。同时, 要针对实际系统,灵活运用各种判断分析方法, 注重平时实际经验的积累, 只有这样才能更好地做好维护工作。
参考文献
[1] 谷昕。 利用光纤通信网络传送继电保护信号 [J]. 电力系统通信, 2004, 25(7): 34-37.
[2] 张越。 SDH技术在数字光传输网中的应用[J]. 光纤技术, 2007, 28(6): 5-7.