4、终端ping网关无延迟和丢包问题。
5、查看交换机日志,确定汇聚和核心上联接口状态存在DOWN和UP反复震荡问题。
判断汇聚到核心两个物理链路接口都有CRC校验错误,并且两个物理链路汇聚接口上都有反复DOWN和UP的日志提示。
由此可以判断是物理线路问题。
剩下的问题就是需要确定的是光模块还是光缆问题。
因为是在网业务运行时间,无法使用替换排除法。所以只能通过命令来查看确定。通过查看光模块光衰,并无异常信息。
但是接口下CRC校验值和日志里面端口反复UP和DOWN震荡信息也可以判定确实光纤线路问题,但光模块下的光衰数据显示无异常!
难道是CRC校验值是之前记录?
端口UP和DOWN的日志是之前的?交换机的时间没有原来的工程师没有调整?
为了验证猜想,工程师把接口的数据信息清除,同时又核验交换机的时间是否和日志事件timetrap一致。
工程师清除接口计数统计后,多次查看接口的信息,发现CRC校验错误又出现了,而且交换机的时间和日志的trap时间一致。
这样看来是汇聚交换机和核心交换机物理链路问题无疑了!
但为什么汇聚交换机搜集到的数据都是正常的呢?难道是光模块后者光模块的跳纤当时没有插紧?
抱着这个怀疑的心态,工程师重新把汇聚交换机上联核心的一个接口重新拔*下,接着诡异的事情发生了。
工程师拔插的那个接口再也无法正常UP起来了!
更换新的模块和跳纤后,这个被拔插后的接口似乎要摆烂到底,就是不会UP了!
重新梳理思路经过这个事件后工程师再也不敢乱动接口的任何设备了。
只能重新梳理思路。
哪些问题会引起CRC校验错误和端口无故UP、DOWN呢?
正在思考的时候,电脑屏幕上突然弹出日志,显示刚才重新拔插光模块的接口UP了,但随机又有一条DOWN的日志出现。
出现频率这么快,肯定不是生成树的影响。
正在这时,工程师的目光注意到汇聚上联到核心的光纤跳纤。
光模块型号10GBASE_LR_SFP好像是单模模块,光纤跳纤怎么是多模的呢?
破案了!客户核心机房到汇聚机房曲曲绕绕有两公里,多模光缆最大传输距离才500米左右,所以主干光缆肯定是单模光缆,接着工程师查看了下主干光缆,确定了他的猜想,主干光缆是单模,跳纤是使用多模。
所以问题就是多模光纤跳线和单模主干光缆直接对接,导致的汇聚交换机上联端口出现大量的CRC错误和接口状态在Up和Down之间反复震荡的现象。
问题思考与总结本案例使用的是单模模块对接的多模跳纤,在这么远的距离在设备上线之初两端设备能够端口协商成功并启动,本来就是一个奇迹。
可是为什么单模模块短距离可以使用多模光纤,但是多模模块不可以使用单模光纤呢?
首先要了解的是单模模块、单模光纤和多模模块、多模光纤的区别和工作机制。
单模模块、单模光纤和多模模块、多模光纤的区别和工作机制
单模模块是使用单一模式传输光信号,支持工作波长一般是1310nm、1550nm,通常单模光模块采用激光器发光。
而多模模块是使用多个模式传输光信号的模块,支持工作的波长一般是850nm,多模采用二极管作为发光源。
单模光纤的芯径几乎与光波波长接近,所以单模光纤在传输光信号时只允许一种模式在其中传播,即最低阶模态(LP01),这种传输方式并不会发生模式色散的问题,基本类似于光直线在光纤中传播。因此,它的传输距离非常远,适用于长距离通信。但是它的带宽容量较低,传输速度较慢,因此在短距离通信中不如多模光纤适用。