文/向建民
本文拟在总结日常故障案例,对问题进行分析,帮助一线运维人员,提高问题解决效率,减少故障处理时间,提升运维人员维护水平。
在室外WLAN覆盖CPE解决方案中,我们将维护界面分为用户侧、基站侧、城域网侧这三个部分。在上期我们提到的很重要的一点,先需定位问题所在的维护层次,才能快速将问题解决。
图1.村村通CPE农村宽带组网示意图
接下来我们以维护界面层次分类,对CPE工程和维护过程中的真实案例进行分享:
1. 城域网侧案例:新老设备不同会造成的上网慢异常丢包吗?
图2.城域网侧网络机房
l 故障现象:
CPE维护工程师反馈新一批安装的CPE终端均出现访问网站慢问题,维护工程师反馈,调整CPE角度、换扇区、更换CPE等都尝试过无法解决,通过360安全卫士、QQ安全管家等PC端的测速软件,带宽只有1Mbps左右,达不到用户开户时4Mbps的带宽标准。
现场维护工程师反馈出现问题的是最近才安装的新设备,怀疑是最近的一批新设备异常导致,而且工程师对新老设备进行替换验证,测试上网速度确实有提高。
l 排查思路:
先详细了解故障详细情况如下:
现场工程师反馈,前期的安装严格按照标准实施,CPE的信号质量在-60dBm内,RSSI值也是在40左右,协商速率也在高速率如104到130范围左右。前期安装时测速都可以达到4Mbps,近期安装的都达不到,这是一个很关键的信息。也就是近期安装的点均出现带宽低,用户访问网站慢问题。
接着了解近期网络是否有改动和变更:
以前测试正常,但现在出现测速异常,接着询问近期是否有割接导致,联系运营商网管相关人员,其反馈近期有对环网上这几个基站的传输进行扩容,问题可能就出现在扩容的传输上,而不是新装的CPE设备问题。
为了验证我们的疑问,通过AC命令display wlan client mac-address 5cdd-1234-f2e1 verbose,查看该AP下CPE的协商速率和RSSI如下:RSSI:39,Rx/Tx Rate:130/144.4,均达到正常开户的标准。
图3.AC上查看CPE的详细信息
查看CPE终端的RFPing情况,wlan link-test 5cdd-1234-f2e1,查看CPE在各个速率的Ping包情况,均为正常情况,只有个别速率有重传,未见到大量丢包情况。
图4.AP对CPE的RFPing情况
经过这两部测试,基本判断用户侧CPE运行正常,CPE到基站侧AP的无线连接正常,问题焦点应该是在基站侧链路到城域网侧这一段。
进行最后测试验证和释疑:
再通过分段法进行排查,在基站侧上联城域网的交换机处,模拟实际用户的PPPoE拨号,拨号后复现问题,发现上网慢,丢包严重问题应该在城域网侧,而非CPE问题。
但是还有疑惑?为什么现场工程师反馈新旧CPE替换后,速率有提升?经过分析主要是工程师在白天进行替换设备验证测试,此时虽然有丢包,但线路上丢包率较小。但在晚上丢包较很严重,但此时却未进行新老设备替换测试。而且近期安装的均为新CPE设备,恰恰出现丢包问题的时间就在新CPE安装期间,更加深了工程师认定是新CPE造成的问题,而没有考虑上端城域网丢包造成的问题。
经测试,在用户侧Ping某外网网站,白天丢包率在7%左右,晚上丢包率在60%,晚上较白天丢包情况严重很多。
图5.白天丢包率在7%左右
图6.晚上丢包率在60%左右
l 解决方案:
经定位,非用户侧CPE和基站侧AP问题,问题出现在上层的城域网数据链路扩容导致,经上端核心网重新配置链路后问题解决,用户侧再次测速,速率达到标称的4Mbps带宽,网络恢复正常。