这个相当于一个云平台,我靠网络来远程到这台电脑上操作,得到结果后再下载到我本地机进行测试。所以这个电脑相当依赖网络,否则我将无法实现远程操作。
下面就来谈谈这个事件的情况。
事件起因:网络反复丢包
基本的网络结构就是,这台戴尔 OptiPlex 990 是接在一台港湾 U Hammer 1024 交换机,通过交换机访问的互联网,至于上层怎么接,我就不是太清楚,很有可能这个故障是受牵连与上层设备的,但是目前只能这么判断,是这两者硬件冲突。
表象就是,该电脑在 Ubuntu 10.10 64 位下,网络严重丢包,估计丢包到了三分之二的水平,同时该电脑还安装了 XP 双系统,启动到 XP 下,可以清楚的看到右下角的网络连接以平均 2 秒一次的周期,网络提示断开,然后又接上,然后又断开,这样反复,感觉就是网线被拔掉,又接上,又拔掉,又接上……
查看电脑后部的网卡灯,也是亮一下,熄灭一下,就是类似被拔插网线的状态。
故障排查
首先想到的是网线或者水晶头松动,但是经检查完好无损。
又想到是否是电脑到交换机的这个线路故障,将该电脑的网线重新接到交换机上的另一个口,状态依旧。旁边有台戴尔服务器服务器,网络也是使用该交换机,网络正常,将其网线接到戴尔 OptiPlex 990 上,故障依旧。
找了一台笔记本电脑,将网线插上测试,网络一切正常!
初步结论:戴尔 OptiPlex 990 网卡损坏
于是乎想到该戴尔 OptiPlex 990 的网卡坏了,报修。
打戴尔的服务热线,接线员按照正常流程走了一遍,先是让我载入 BIOS 的默认值,重启后故障同样,给我全套戴尔 OptiPlex 990 驱动,重新安装,还是一样(驱动应该没有多大问题,因为戴尔 OptiPlex 990 还工作在 Linux 环境下)。
第二天配件发到我所在市,第三天戴尔服务人员上门更换主板。因为戴尔 OptiPlex 990 是集成显卡,只有换主板了。
郁闷的是,换完主板,故障还是一样,崩溃……
跟维修人员说,只能归结是网络故障。
继续排查测试
将这台戴尔 OptiPlex 990 搬到我自己所用的办公网络下,是另外一台交换机,于是乎,网卡故障消失!
最终结论:交换机与电脑网卡冲突
因为戴尔 OptiPlex 990 接在港湾的交换机上,大部分时间是好的,这样的丢包是偶然发生,而且发生一般是一天以上。
我也怀疑是这台电脑、交换机与其他某设备共同作用冲突,但是无法判断,办公室将近几百的电脑,怎么排查啊?
那么,我的办法就是,不要让这台电脑与这个交换机直接连接。虽然找不到具体的原因,但是得出这样的结论已经足够了。
按照这个思路,在两者之间串接一台其他的交换机,应该就好了。
经测试,我在港湾交换机的端口上接了一台中兴的 2818S,然后又从中兴交换机上再接一根网线到电脑上,使用此方法解决了该故障。目前一切正常。
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。