一、故障现象:
南靖反馈船场机房下带的用户(50M以上带宽)通过集团速度测量软件测试达不到签约速率,可通过360宽带速度测量或雷电下载达到签约速率。
二、故障分析:
根据现场测试结果简单分析。
1、现场技术人员直接在船场机房瑞斯康达OLT下挂ONU,笔记本拨号测试,排除无线连接速度不足引起的速度不符合标准。
2、怀疑链路各级设备是不是有流量限制,但网络速度正常,速度服务器下挂在核心路由上,如有限速,各地市的测试结果应该都会受影响,目前只有南靖船场速度异常,可排除速度限制原因。
3、通过IxChariot在船场机房PC和市公司宽带制作PC之前测试吞吐量,结果与网络测量速度相同,可以达到签约带宽。
初步判断是不是集团速度测试软件测试机制存在问题,网络速度不符合标准,但存在疑问,其他地区测试正常,与速度测试软件开发者联系,建议通过速度测试服务器内的视频文件下载速度。
三、故障调查:
南靖船场大致网络拓扑结构如下
图5:南靖船场拓扑图
1、与南靖技术人员合作现场测试,与以前反馈的结果相同,迅速下载速度服务器内的视频文件也能达到签约速率。
2、直接用5720上端口拨号测试(不通过OLT、ONU),结果相同。
3、通过安卓版测速APP多线程测试,发现可以达到签约速率。
4、此前总结了前期各测试的差异。
不符合标准:苹果和网页测试都是单线程。
符合标准:IxChariot为5线程测试,360速度连接多个速度服务器进行下载测试,迅速下载网络资源使用P2P技术。
因此,怀疑单线程传输速度是不是不足导致苹果手机和网页的测速不达标,单线程速度和多线程速度的简单区别如下
单线程文件传输基于单套接字(包括客户IP地址、客户端口号、服务器IP地址和服务器端口号的4元组,可以唯一确定互联网TCP连接的双方)。
多线程文件传输基于多套接字
5、在各节点设置速度测试点,分别进行测试,本次利用Mikrotik路由器内置的带宽测试功能。
①速度节点B-A:直接在南靖中心机房9706端口拨号进行速度测试,下载速度可以达到账户带宽。
②速度节点C-A:50M的账户单线程只能达到20M以上,多线程速度可以达到账户带宽。
③速度节点B-C:由于缺乏100M上行帐户,直接在两个地方配置固定IP进行测试,单线程传输速度变动大,远远低于链路带宽(该测试路由器TCP单线程速度应达到300Mbps以上,见后续测试)。
最终,故障范围基本上可以确定为9706下光模块、物理链路、5720交换机。由于两个地方的距离很远,决定重新跳一芯至船场机房,更换一对光模块,更换后各测试结果正常
四、后续测试:
1.交换机千兆口转发速度:设备直接连接交换机端口进行测试,tcp连接单线程测量速度在300mbps左右,UDP测量速度在870mbps左右。
受到测试用设备性能的限制,TCP速度达到300Mbps左右的设备CPU达到100%,无法实际反应交换机端口的转发性能,仅供参考。
2.光模块测试:在故障调查过程中,南靖中心机房9706光模块发光,接收-23.67dbm,低于接收灵敏度建议值,但在警告阀值范围内。根据传输距离估算,该值远低于理论值。更换纤芯后,接收光为-9.79dBM,然后测试该光模块,将接收光降至-24.09dBM,测试下载速度正常。3.看船场华为5720,下行方向inerror存在大量错误包,重新跳芯后,该值不再增加。
4.通过OTDR测试原路线,发现距南靖中心机房500米左右中断。
五、排出障碍的总结:
这次故障的调查经验不足,走了很多弯路,花了很长时间。此次调查进一步了解了各种故障原因、设备性能、调查手段。在故障检查过程中,各种测试方法应尽可能模拟原故障环境,逐步检查。