论文部分内容阅读
本文通过对SDH各种网络保护中光纤错连引发的业务连通性和保护倒换的影响进行了深入分析,并给出多种判断光纤接序的方法,并对比其优劣。
1.现象描述与技术分析
运营商的传输网络中,有时会出现光纤错连的问题,可能是熔纤错误、ODF架跳纤错误等原因。在不同的组网情况下,光纤错连可能会对业务产生不同的影响。
1.1情况1:光纤错连导致收发接反
这时光板会有R-LOS告警等,引起网络倒换或业务中断,这类情况属低级错误,很容易分析判断,这里不再赘述。
1.2情况2:环网中东西向光纤错连
即本应连接东向光板的收纤被误连到西向光板的IN口,本应连接东向光板的发纤被误连到西向光板的OUT口,类似东西向光板带光纤对调。
1.2.1双向MSP环分析
这种问题,在双向MSP环中将导致业务中断,易于发现。同时保护倒换也无法成功,因为K字节传递错误或说APS协议紊乱。不过,光路正常时业务已经中断,因此这里没必要再赘述。
1.2.2 SNCP/PP环分析
这种问题,在SNCP/PP环中,由于业务双发选收,对业务没有影响,东西向穿通的业务也是正常的,只是可能导致时钟互相跟踪,引发指针调整,短期内也影响不大。同时,对于SNCP/PP环,很可能会有另外一个小问题:光缆中断时,网络保护倒换状态可能异常。
我们举一个例子分析一下,如下图,NE1为中心站点,与任意1个网元都有1个E1业务。东发西收为主环方向,图中以逆时针方向标示。但此时,NE3的东西向光纤接反。
容易发现,由于NE3的东西向光纤接反,NE3/4互连的都是西向光板,这将导致他们时钟互相跟踪,导致NE1/2与NE3/4不同步,引发网络指针调整,严重时将引起滑码或业务中断。
我们再来分析断纤保护状态。当NE1/2之间光缆中断时,NE2转而从东向收备环业务,是倒换状态,这是正常的;NE3由于东西向光纤接反,NE1/2之间光缆中断相当于NE3东向中断,丝毫不影响它从西向收主环业务,自然不会倒换,状态异常;而NE4无法从西向收到主环业务,从东向收备环业务,是倒换状态,这也是正常的。也即只有NE3的倒换状态异常。
同样道理,当NE2/3之间光缆中断时,也只有NE3的倒换状态异常。
我们再来分析NE3/4之间光缆中断的情况,NE2不受如何影响,从主环接收业务,一切正常;NE3由于东西向光纤接反,NE3/4之间光缆中断恰恰相当于NE3西向中断,NE3只能倒换到从东向收备环业务,即倒换状态,这是异常的;而NE4无法从西向收到主环业务,从东向收备环业务,是倒换状态,这也是正常的;对于NE1,从西向收NE4的业务正常,无需倒换,而必需倒换到从东向备环收NE2/3的业务,即倒换状态,这些,对NE1来说是正常的。
类似的分析可知,当NE1/4之间光缆中断时,也只有NE3的倒换状态异常。
总而言之,我们可以得出结论,对于存在东西向光纤错连的SNCP/PP环,业务可以的畅通,但发生断纤倒换时,光纤被错连的网元的倒换状态异常。因此,我们在日常网络巡检时,时常会发现网络中存在这种情况。
2.建议与总结
基于上面的分析,我们得出以下建议和总结,帮助大家的工程和维护工作。
2.1如何判断SDH网络光纤接序
下面给出一些判断SDH网络光纤接序的方法,并对比其优劣。
2.1.1断纤测试法
通常,拔掉发纤,对端会上报R-LOS告警,本端回传MS-RDI。拔掉收纤与之类似。这种方法可一次判断来回的一对光纤,且不依赖于业务配置。当然,拔纤测试法属高度危险操作,仅适合于工程调测阶段,要慎用。
2.1.2下插告警法
下插相关告警,查看下游告警产生的位置,从而判断光纤接序。
(1)下插MS-AIS。
如在NE1东向下插MS-AIS,实际上是把这个光口的K2字节的bit5~7置“111”发送出去,对端即NE2的西向收到该信息后,解读上报MS-AIS告警;同时,NE2将西向光口的K2字节的bit5~7置“110”发送出去,对端即NE1东向收到该信息后,解读上报MS-RDI告警。
这样,也就一次判断来回的一对光纤,且不依赖于业务配置。当然,下插MS-AIS告警会导致下游信号下插全“1”,引起业务中断或保护倒换,属高度危险操作,仅适合于工程调测阶段,要慎用。
(2)下插MS-RDI。
同时,我们有可使用下插MS-RDI方法,即把本端光口的K2字节的bit5~7置“110” 发送出去,对端收到该信息后,解读上报MS-DRI告警。若要判断另一方向,需要在对端重复相同操作。下插MS-RDI不会引起業务中断或保护倒换,可用于实际网络。
同时,也有下插TU-AIS的方法,但它会随着业务下到PDH支路时才能被检测上报,无法用于判断光纤接序。
2.1.3 ECC路由分析法
这种方法比较复杂、繁琐。首先,在NE1用ecc-get-route(4.0命令行)或cm-get-eccroute查询连同到NE2的路由号,如“0”号路由。在NE1再用ecc-get-bdinfo或ecc-get-sccinfo查询这个“0”号路由对应哪块光板的哪个光口。这样,就能知道NE1是通过哪块光板的哪个光口连接到NE2的了。
的确很繁琐,唯一的好处是不影响业务。
2.2一些维护建议
一些年轻的工程师认为,没有TU-AIS等异常告警,就标明业务正常。这是一个非常错误的观念。我们知道,SDH设备判断下行业务好坏的常用方法是检测指针或开销字节,如果他们正常就认为业务畅通,而无法判断业务的端到端连通性。比如,链路上发生了“环回”,但却没有TU-AIS等异常告警。这个结论告诉我们,不要“轻易相信”SDH网络的告警信息,尤其在扩容、改造等操作后,一定要请交换、基站等维护人员配合,确认业务是否真的正常。这是无数血的教训积累下来的经验。
这里,还要提醒大家工程维护中使用2M误码仪的规范性,一定要“通”、“断”两种状态都测,不能应付了事。“通”是说明存在收到业务的通道;而“断”是为了证实这就是我们要测试的通道。
另外,上面的例子中,虽然问题的分析非常复杂,但其实有一个很明显的征兆——NE3脱管。原因很简单,就是ECC默认需要的收发一致的路由中断了。当然,我们一般以为,ECC与业务中断似乎没有必然联系,从而忽视了这个宝贵的线索。同时,光缆恢复后10分钟业务中断,这也很容易提醒我们是倒换恢复引起的。当然,如何分析出链路中的“环回”,这个还是需要经验的。[科]
1.现象描述与技术分析
运营商的传输网络中,有时会出现光纤错连的问题,可能是熔纤错误、ODF架跳纤错误等原因。在不同的组网情况下,光纤错连可能会对业务产生不同的影响。
1.1情况1:光纤错连导致收发接反
这时光板会有R-LOS告警等,引起网络倒换或业务中断,这类情况属低级错误,很容易分析判断,这里不再赘述。
1.2情况2:环网中东西向光纤错连
即本应连接东向光板的收纤被误连到西向光板的IN口,本应连接东向光板的发纤被误连到西向光板的OUT口,类似东西向光板带光纤对调。
1.2.1双向MSP环分析
这种问题,在双向MSP环中将导致业务中断,易于发现。同时保护倒换也无法成功,因为K字节传递错误或说APS协议紊乱。不过,光路正常时业务已经中断,因此这里没必要再赘述。
1.2.2 SNCP/PP环分析
这种问题,在SNCP/PP环中,由于业务双发选收,对业务没有影响,东西向穿通的业务也是正常的,只是可能导致时钟互相跟踪,引发指针调整,短期内也影响不大。同时,对于SNCP/PP环,很可能会有另外一个小问题:光缆中断时,网络保护倒换状态可能异常。
我们举一个例子分析一下,如下图,NE1为中心站点,与任意1个网元都有1个E1业务。东发西收为主环方向,图中以逆时针方向标示。但此时,NE3的东西向光纤接反。
容易发现,由于NE3的东西向光纤接反,NE3/4互连的都是西向光板,这将导致他们时钟互相跟踪,导致NE1/2与NE3/4不同步,引发网络指针调整,严重时将引起滑码或业务中断。
我们再来分析断纤保护状态。当NE1/2之间光缆中断时,NE2转而从东向收备环业务,是倒换状态,这是正常的;NE3由于东西向光纤接反,NE1/2之间光缆中断相当于NE3东向中断,丝毫不影响它从西向收主环业务,自然不会倒换,状态异常;而NE4无法从西向收到主环业务,从东向收备环业务,是倒换状态,这也是正常的。也即只有NE3的倒换状态异常。
同样道理,当NE2/3之间光缆中断时,也只有NE3的倒换状态异常。
我们再来分析NE3/4之间光缆中断的情况,NE2不受如何影响,从主环接收业务,一切正常;NE3由于东西向光纤接反,NE3/4之间光缆中断恰恰相当于NE3西向中断,NE3只能倒换到从东向收备环业务,即倒换状态,这是异常的;而NE4无法从西向收到主环业务,从东向收备环业务,是倒换状态,这也是正常的;对于NE1,从西向收NE4的业务正常,无需倒换,而必需倒换到从东向备环收NE2/3的业务,即倒换状态,这些,对NE1来说是正常的。
类似的分析可知,当NE1/4之间光缆中断时,也只有NE3的倒换状态异常。
总而言之,我们可以得出结论,对于存在东西向光纤错连的SNCP/PP环,业务可以的畅通,但发生断纤倒换时,光纤被错连的网元的倒换状态异常。因此,我们在日常网络巡检时,时常会发现网络中存在这种情况。
2.建议与总结
基于上面的分析,我们得出以下建议和总结,帮助大家的工程和维护工作。
2.1如何判断SDH网络光纤接序
下面给出一些判断SDH网络光纤接序的方法,并对比其优劣。
2.1.1断纤测试法
通常,拔掉发纤,对端会上报R-LOS告警,本端回传MS-RDI。拔掉收纤与之类似。这种方法可一次判断来回的一对光纤,且不依赖于业务配置。当然,拔纤测试法属高度危险操作,仅适合于工程调测阶段,要慎用。
2.1.2下插告警法
下插相关告警,查看下游告警产生的位置,从而判断光纤接序。
(1)下插MS-AIS。
如在NE1东向下插MS-AIS,实际上是把这个光口的K2字节的bit5~7置“111”发送出去,对端即NE2的西向收到该信息后,解读上报MS-AIS告警;同时,NE2将西向光口的K2字节的bit5~7置“110”发送出去,对端即NE1东向收到该信息后,解读上报MS-RDI告警。
这样,也就一次判断来回的一对光纤,且不依赖于业务配置。当然,下插MS-AIS告警会导致下游信号下插全“1”,引起业务中断或保护倒换,属高度危险操作,仅适合于工程调测阶段,要慎用。
(2)下插MS-RDI。
同时,我们有可使用下插MS-RDI方法,即把本端光口的K2字节的bit5~7置“110” 发送出去,对端收到该信息后,解读上报MS-DRI告警。若要判断另一方向,需要在对端重复相同操作。下插MS-RDI不会引起業务中断或保护倒换,可用于实际网络。
同时,也有下插TU-AIS的方法,但它会随着业务下到PDH支路时才能被检测上报,无法用于判断光纤接序。
2.1.3 ECC路由分析法
这种方法比较复杂、繁琐。首先,在NE1用ecc-get-route(4.0命令行)或cm-get-eccroute查询连同到NE2的路由号,如“0”号路由。在NE1再用ecc-get-bdinfo或ecc-get-sccinfo查询这个“0”号路由对应哪块光板的哪个光口。这样,就能知道NE1是通过哪块光板的哪个光口连接到NE2的了。
的确很繁琐,唯一的好处是不影响业务。
2.2一些维护建议
一些年轻的工程师认为,没有TU-AIS等异常告警,就标明业务正常。这是一个非常错误的观念。我们知道,SDH设备判断下行业务好坏的常用方法是检测指针或开销字节,如果他们正常就认为业务畅通,而无法判断业务的端到端连通性。比如,链路上发生了“环回”,但却没有TU-AIS等异常告警。这个结论告诉我们,不要“轻易相信”SDH网络的告警信息,尤其在扩容、改造等操作后,一定要请交换、基站等维护人员配合,确认业务是否真的正常。这是无数血的教训积累下来的经验。
这里,还要提醒大家工程维护中使用2M误码仪的规范性,一定要“通”、“断”两种状态都测,不能应付了事。“通”是说明存在收到业务的通道;而“断”是为了证实这就是我们要测试的通道。
另外,上面的例子中,虽然问题的分析非常复杂,但其实有一个很明显的征兆——NE3脱管。原因很简单,就是ECC默认需要的收发一致的路由中断了。当然,我们一般以为,ECC与业务中断似乎没有必然联系,从而忽视了这个宝贵的线索。同时,光缆恢复后10分钟业务中断,这也很容易提醒我们是倒换恢复引起的。当然,如何分析出链路中的“环回”,这个还是需要经验的。[科]