网络故障范文

时间:2023-03-26 08:01:00

导语:如何才能写好一篇网络故障,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

网络故障

篇1

本文简述了作者在维护网络过程中,遇到的网络故障及处理方法,希望对大家的网络维护工作起到促进作用。

计算机网络的组成

计算机网络就是利用通讯线路和通信设备,用一定的连接方法,将分布在不同地点的具有独立功能的多台计算机系统相互联结起来,在网络软件的支持下进行数据通信,实现资源共享的功能。除了计算机外,用于连接网络的硬件设备有光缆、光收发器、双绞线、路由器、交换机、网络适配器(网卡)等。一般造成网络不通的大部分原因都是这些设备出了故障。下面我们将对它们出现的故障进行简要的分析。

光缆和光纤

光缆的故障主要是光缆折断,由于光缆内部有用于抗拉伸力量的钢丝,所以光缆自然折断的可能性不大,但由于道路施工等多种原因,光缆被铲车挖断或汽车挂断的事情还是时有发生。例如,去年四月,我台的外网光缆被施工的汽车挂断,几周后,内网光缆又被其他车辆挂断。另外,由于传输光信号的光纤十分细微,在检修ODF柜时要特别小心,防止折断尾纤。工程中对光纤和光缆的弯曲度都有严格的要求,实用光纤最小弯曲半径一般为20~50mm,光缆最小弯曲半径为200~500mm,等于或大于光纤最小弯曲半径,光辐射引起的附加损耗可以忽略,若小于最小弯曲半径,附加损耗则急剧增加。

测量光缆、光纤跳线是否中断的简便设备是光功率计。如果察看到光收发器上的RX指示灯灭掉,或用光功率计测量接在光收发器上RX口上的光纤跳线没有光功率,即可断定光缆或尾纤折断,通知网络公司进行抢修。

尾纤或者光纤跳线出现故障的另一个现象是由于长时间使用,它们的纤芯端面可能会比较脏,对光信号会产生折射或散射作用,造成网络传输速度下降或丢包现象。处理该故障的方法是用医酒精轻轻擦拭光纤纤芯的端面,稍等一下,待酒精蒸发完毕后恢复连接就可以了。

光收发器

光收发器的作用是将在光缆中传输的光信号转变为适于在电缆中传输的电信号。我们在维护网络工作中遇到的光收发器的故障主要是其电源故障和过热故障。

电源故障主要是其内部变压器的线圈烧毁或者整流电容爆裂。线圈烧毁造成变压器次级电路无法得到电源,而整流电容爆裂造成后面的电路得不到直流供电。如果我们发现正在使用的光收发器的电源指示灯熄灭了,则肯定是其电源部分出了故障。

光收发器的维护还要注意其工作温度问题。光收发器多位于楼房的单元门口网络设备箱内,通风不畅,有的网络设备箱甚至直接被太阳曝晒,造成光收发器工作过热而死机。表现为用手触摸光收发器有发烫的感觉,其TX、RX指示灯闪烁缓慢,在连接的计算机上上网时,无法正常浏览网页,有严重的丢包现象。这样,当光收发器的温度下降以后,该故障会自动解除。

网线

网线分为直连线和交叉线。现在国际上通用制作网线的标准为T568A和T568B两种。T568A的标准线序为:绿白、绿、橙白、蓝、蓝白、橙、棕白、棕,T568B的标准线序为:橙白、橙、绿白、蓝、蓝白、绿、棕白、棕,两端的RJ-45头中的线序一致的双绞线称为直通线;而一端为T568A,另一端为T568B的网线称为交叉线。虽然双绞线有4对8条芯线,但实际上在网络中只用到了其中的4条,即水晶头的第一、二、三和六脚,它们分别起着收、发信号的作用。网线的故障主要表现在以下两个方面:第一,虽然很多网络设备都有自适应功能,但有些特殊设备对网线的连接有着特殊要求,例如要求连接两个设备的网线为交叉线,而我们习惯上大多都做成了直通线。第二,水晶头制作得不好。水晶头在制作以前,网线需剥去约1.5cm,不熟练的同志制作时,不是剥去得太长了就是太短了,致使压下去的水晶头卡不住网线或网线不能完全插到水晶头底部与插针良好接触。事实上,网络硬件不通的大多原因在于网线的不通。遇到这样的故障,处理的方法是:1、按照网络设备的要求,规范制作网线。2、用网线测试仪测试一下网线,若发现不通,重新制作一下水晶头就可以了。

交换机

交换机的作用是为连接在同一个网络中的计算机提供信息交换的途径。家庭用的一般都是没有管理功能的交换机,其中以桌面交换机居多。例如我台职工平房宿舍和公寓楼,居住人数不多,使用的多是8换机。维护过程中,发现光纤和网线测试没有问题,光收发器工作亦正常,但整排平房用户依然不能上网,后来发现把8换机的电源关闭一下,重新开启,然后网络恢复正常。分析原因,可能是该交换机内部有少量的内存,估计是否是交换机遇到网络风暴死机所致。此种故障在我台不同的8换机发现了有多次,均用此方法处理,网络故障均得以很快解决,其详细原因待查。

光纤耦合器

光纤耦合器,俗称法兰盘,在网络中的作用是定位上一级尾纤或光纤跳线的纤芯与下一级尾纤或光纤跳线的纤芯准确对接,使传输的光信号按照设计的路径继续向下一级传输。我们在维护网络的过程中,经常遇到光纤耦合器的故障是耦合器中间的塑料套圈发生了变形。

我台乙机房距离台区大约有十公里,乙机房与台区通过光缆进行通信。在维护乙机房网络的过程中,发现了一个奇怪的现象:乙机房的内网计算机能够正常浏览网页,但是无论如何使用FTP服务传送不了数据。没有办法,我们从中心交换机到光收发器、光收发器到ODF柜、ODF柜到乙机房光缆终端盒、乙机房光缆终端盒再到内网计算机,一级一级展开查找故障,最终发现是ODF柜上到乙机房的两芯光纤中的一芯的光纤耦合器中间的塑料套圈发生了变形,影响了光信号的正常传输,更换光纤耦合器后故障解除。分析原因可能是塑料套圈变形导致了耦合器定位前后两条光纤跳线纤芯对接不准,造成光纤传输数据率降低,从而出现了网络不能实现FTP业务但能正常浏览网页的怪异现象。

网卡

网卡简称网络接口卡(Network Interface Card,NIC),是计算机局域网中重要的连接设备之一,计算机通过网卡接入网络。在计算机网络中,网卡一方面负责接收网络上发送给本机的数据包,解包后,将数据传输给本地计算机,另一方面将本地计算机上的数据打包后送出网络。我们在网络维护工作中遇到的网卡问题是网卡的自适应功能。

我们在维护职工宿舍网络时,发现有位同事的计算机不能上网,而连接在同一交换机上的其他同事的计算机均能正常上网,测量交换机至故障计算机的网线正常,因而怀疑连接该网线的交换机的端口有问题,随后将该网线插在交换机的另一端口上,仍然不能上网。后来,修改网卡的属性,将其“链路速率和全双工模式”由“自适应”修改为“10兆/全双工模式”,故障计算机上网正常。分析可能是一般的计算机的网卡均支持自适应功能,而该计算机的网卡不支持自适应功能,而我台的外网开口带宽速率恰是10Msps。

篇2

某日清晨,一些教师反映不能上网了,网关都Ping不通,仔细观察,电脑的网络设置正确,连接指示也没有大量的数据收发,网关ARP也未被修改,重启后故障依旧。

教师机的软件方面似乎没有问题,也不像被攻击,是网卡损坏?但昨天还都正常工作,今天不应该数台同时坏。拟先抓包分析,再定对策。

将教师机网线插入,启动科来网络分析系统,不到一分钟,就抓到很多数据。

可以看出,网络内充斥着大量的广播数据,高峰时每秒近4万个包,这是一个不正常的 地方,第一反应是很有可能被DDOS攻击。

但看到协议统计后发现,量最大的是一种平时流量很少的NetBIOS广播数据,这种协议常见于WIN2K以前的网络应用中,现在的网络程序一般采用WinSOCK接口,很少使用NetBIOS接口了,许多网络中甚至都禁用了NetBIOS。这又是一个不正常的地方。是可能有古老的NetBIOS程序在进行拒绝攻击吗?

由于校园网已经划分了VLAN,而VLAN的主要作用就是隔离这种广播数据包,所以可以肯定这种数据包出自本地子网节点中,查看数据包内容,发现数据均为同一台电脑所发送,根据MAC,轻易定位到问题源,将其关机。

本以为问题将暂时解决,待随后再分析原因。但此时竟然发现子网内还是不通,频密的数据包仍源源不断地流通,将带宽耗尽。是有程序在利用虚构的MAC地址进行攻击吗?如果这样就很难定位数据源了。仔细分析数据包,终于发现了问题所在,有大量IP标识相同的数据。IP标示为5618和5616的NetBIOS名字服务广播包重复出现了2次。这意味着什么呢?

我们知道,在IP协议中,每个数据包IP数据头内第一个标识位的值应该是唯一的,即系统在发出数据时,对每个数据包连续递增编号,用来让对方以正确的顺序重组数据。数据包的标识相同,说明某些广播数据包完成使命后没有正常消失,而是重新被发回到了网络中,致使类似数据越来越多,阻塞了网络。这种现象一般是由于网络环路所引起,应检查交换机是否存在环路。

仔细检查该VLAN的交换机及上联的交换机,终于发现在上联的交换机中除了原有的级联线外又被接了一

根级联线。拔掉后重启交换机,网络故障排除,大家又可以正常上网了。

网络环路是一种技术很低级、后果很严重的错误。校园网以前一直能正常运行,怎么会突然出现这种错误呢?

后经询问得知,电脑公司工人前一日为一台新入网电脑做网线头,做完后发现有一根网线头垂在外边,以为是交换机上的网线意外脱离了,就好心地找了个空口插了进去,其实那是根备用网线。

目前可网管的较高档交换机均支持STP(生成树协议),在该协议作用下,即便交换机间形成复杂的环路,交换机仍会自动选择一条通路,而封闭其他冗余路径,这样就不会出现广播风暴,仍能正常工作。但绝大多数交换机的STP协议状态缺省是关闭的,需手工打开方起作用。

措施:将所有交换机上连接的网线进行全面排查,暂时用不到的多余线一律妥善收好;凡是支持STP协议的交换机,将其协议状态打开,避免类似情况再次发生。

经过一番努力,网络终于又恢复正常,但回头一想,颇生感慨:布网时,为防万一,大家都喜欢留根备用线,但平时不用时把它收好了吗?交换机支持STP协议吗?开启了吗?如果没有,赶快想对策吧。投资几十万、上百万的网络,但却顶不住一根小小的线头。

参考文献

篇3

关键词:工业以太网 网络故障 杂波过滤 电磁屏蔽 网络结构优化

中图分类号:TP273 文献标识码:A 文章编号:1674-098X(2013)02(c)-00-03

Ethernet/IP工业以太网作为一种新兴的行业技术,目前已成为下一代工业产品中最具发展潜力和特点的技术,广泛应用于采矿、食品生产、污水处理等工业领域,在济南、厦门、武汉等多家国内卷烟生产厂得到实际应用[5-7],在烟草行业中,Ethernet/IP工业以太网主要应用在烟草制丝的自动化控制环节[7-8]。不同于DeviceNet、ControlNet等传统的现场工业总线[1],以太网采用带有冲突检测的载波侦听多路访问协议(CSMA/CD),实时性较差,加上其特有的超时重发机制,使得网络中单点的故障容易扩散[2-4],给整个网络通讯带来沉重的负担,因此网络故障对工业以太网的稳定运行造成较大影响。在目前国内外的相关研究中,对于网络故障发生的具体成因尚无明确的定论,对于应用实例中的网络故障源头缺乏有效的排查手段,少数的工业以太网故障排除案例[9]由于网络构架、硬件设备等与烟草行业应用存在较大差别,其经验无法得到有效推广,至今缺少切实有效的方法应对工业以太网的网络故障。尝试使用网络构架优化、传输介质改进、现场杂波过滤屏蔽等方法,降低网络故障的发生频次。

1 改造前网络状况概述

武汉卷烟厂两条黄鹤楼淡雅香生产线(A线、B线)均使用洛克韦尔自动化公司(Rockwell Automation)的工业以太网,实现“一网到底”的思路[7][10]。整条生产线叶片处理线、叶丝处理线、混丝处理线和加香处理线4个控制工艺段。其中、叶片段的设备构架最为复杂、网络故障的发生最为频繁,以叶片处理段为例,尝试使用多种方法进行改进研究。

黄鹤楼淡雅香生产线叶片段共包含切片、回潮、加料、储叶共4个工序段。其主要设备包括:1块Logix5555 CPU、2块内网网卡、1块外网网卡、1个远程IO、3台交换机、20个分布式子站、32台变频器。其网络构架如图1。

工业以太网数据传输采用竞争机制,在数据通讯量过大时,容易造成网络阻塞,无法满足工业控制领域对实时性的要求;从原有的网络构架中可以看出,所有的20个子站及32台变频器组均通过内网网卡1这一通道进行通讯,巨大的数据量造成了沉重的通讯压力,通讯不畅造成的网络阻塞常有发生。另由于工业以太网“呼叫―应答”机制的作用,一旦某一网络节点通讯不畅,会一直发送数据包寻找该节点直到网络收到该节点的应答响应为止,这种机制会加重网络负担,在武汉卷烟厂也片段原有的网络架构中,一旦某一节点的通讯不畅,则会对整个网络产生影响。例如一条生产线保养中分断变频器电源,则另一条生产线会发生网络故障中断生产。

2 改进方法

2.1 对网络构架进行优化

将黄鹤楼A线、B线以及加料段分离:增加1块CPU控制A线设备、原有CPU仅作B线控制,并将原有CPU内部控制程序按A/B线进行分离;A/B线加料CPU从原有机架独立出来自成一体,并使用光纤替代以太网线与原有机架上的CPU通讯;每块CPU均配置一块以太网网卡,每块网卡相互之间不交联,仅与各自的CPU进行通讯;将所有通讯节点(子站、变频器)按照A/B线及A/B线加料划分为4个部分,分别接入独立的交换机通过各自CPU对应的网卡通讯;A线与B线CPU之间利用机架背板通讯、A/B线加料CPU之间使用光纤通讯。改造后的网络构架如图2。

改造后,原有的网络节点被划分成4个部分:A/B线及A/B线加料。每个部分通过独立的通讯通道与CPU通讯。整个网络由改造前的1个通讯通道连接52个节点变为改造后的4个通讯通道连接52个节点,节点分布状态如表1。

2.2 对网络传输介质进行改进

由于工业以太网良好的兼容性,武汉卷烟厂从企业信息层到现场控制层采用以太网“一网到底”的思路[7],因此叶片段的网络传输介质以普通以太网的通用8芯网线为主,而这种常规的通用屏蔽双绞线其内阻、线间电容等参数无法与工业交换机匹配,抗电磁干扰能力较差,传输距离上存在限

制[2],网线水晶头的制作要求高,通讯质量不理想。

西门子原装Profinet 4芯网线,支持TCP/IP通讯协议,采用双层屏蔽,抗干扰性好、通讯质量优秀,且配有FC(快速连接)工具,接头制作质量有保障。将叶片段原有的通用8芯双绞线统一更换为西门子Profinet 4芯网线,网络抗干扰能力有明显增强,网络报警频次进一步减少。

3 对于环境杂波干扰进行屏蔽和过滤

在对叶片段的网络进行了网络构架的重组和传输介质的更换后,网络故障报警次数大幅减少,但两条生产线同时生产时偶尔还会出现I/O子站的通讯故障。

①考虑到I/O子站内动力电源以及电机单元频繁启动/停止对网络传输造成的影响,将子站通讯网线重新走线,与动力电缆分离,并用金属管进行屏蔽。

②交换机本身具有过滤杂波和减少冲突域的功能,因此在每个子站中增加一个滤波交换机(在武汉卷烟厂应用中选用带接地功能的菲尼克斯5换机),由电柜总交换机布放而来的西门子Profinet 4芯网线首先接入子站的滤波交换机,而后通过另一段网线接入I/O子站的网卡。由滤波交换机接入子站网卡的这段网线,最初选用的是同型的西门子Profinet 4芯网线,实际使用效果不好,网络故障仍时有发生,而当使用非屏蔽的普通8芯安普网线替代西门子Profinet 4芯网线后,网络通讯质量大大改善,在生产过程中未再发生I/O子站通讯故障。

采用上述多种方法对原有网络进行改进后,分别统计改进前后5个月的网络故障报警次数并进行对比,统计结果如表2。

上表数据表明,改进后,网络通讯质量得到明显改变,极大降低了工业以太网网络故障的发生频次,达到改进的预期效果。

4 结语

应对工业以太网使用过程中频繁发生的网络故障,使用多种方法改进原有网络,基本思路如下:

(1)优化网络结构,减少单个网络通道中的数据通讯量;不同生产线、甚至部分重要主机设备实现网络隔离,避免相互影响。(2)网络介质选用屏蔽良好、通讯质量优秀的西门子原装Profinet 4芯网线替代通用8芯双绞线。(3)注意网络布线的外界环境,使其远离动力电源、变频器等干扰源,并进行良好的电磁屏蔽。在网络故障发生较高的节点,可增加子交换机进行杂波

滤波。

经过改造,Ethernet/IP工业以太网的网络故障发生频次大大降低,网络通讯质量得到明显改善,间接提高了生产过程的连续性、一定程度上保证了过程工艺质量。上述经验可用于所有Ethernet/IP工业以太网应用场合,具有良好的推广和借鉴意义。

参考文献

[1] 安淑玉;郑路;李晓荃.现场总线通信协议分析及现场总线技术应用[J].烟草科技,2004(9):23-26.

[2] 陈昕光,许勇.以太网应用于工业控制系统的实时性研究[J].自动化仪表,2005,26(8):10.

[3] 徐皑冬,王宏,邢志浩.工业以太网实时通信技术[J].信息与控制,2005,34(1):60-65.

[4] 吴爱国,梁瑾,金文.工业以太网的发展现状[J].信息与控制,2003,32(5):458-461.

[5] 李武杰,郑晟,陈文辉.Ethernet/IP工业以太网的研究及应用[J].电子设计工程,2011,19(9):26-29.

[6] 高丽,林里,孔若英.EtherNet/IP在工业控制领域的应用研究[J].电脑知识与技术,2007(2):423-455.

[7] 赖林,万铀,王建新,等.Ethernet/IP工业以太网在制丝线控制系统中的应用[J].烟草科技,2007(7):14-17.

[8] 普永金.Ethernet/IP工业以太网在烟草行业的应用[J].国内外机电一体化技术,2009(2):10-11.

篇4

【关键词】网络故障;故障诊断;接口故障

1.计算机网络故障的分类

一般而言,计算机网络故障按照排除的难易程度来分,可以分为常规和非常规的;按照故障的性质来分,可以分为计算机硬件故障、计算机软件故障;根据网络故障的具体情况又可以分为:物理类故障和逻辑类故障两大类。

2.计算机网络故障的分类分析

计算机网络常规故障是指那些很容易处理的,类似DHCP地址出错等不用很专业人士都可以进行检修和修复的故障类型;而计算机非常规故障是指那些不易识别或排除的问题,是需要专业的网管人员通过一定方法进行排除的。

2.1 常规问题

①当我们打开计算机和网络的时候,有时候会看到网络连接的图标已经运行,但是却打不开网页,当我们点开图标,会看到图标上有数据包无法接收的现象,查看原因就知道是网关出现了障碍,这个时候可以对IP地址或DNS进行重新设置:这些地址是由网管统一设置的,所以在进行设置时更要注意字段和符号问题,必须按照IP地址的分配原则去进行。因为在网络地址的配置中从1开始到254结束的任意整数都可以成为独立计算机的IP,每台计算机的地址无法重复的。还有一种是网络给出了提示,这样的障碍是可以这样来排除的:建立链接之后,使用工具从服务器申请DHCP地址,通过从交换机获得的Cisco发现协议(CDP)报告,检查工具所连接的交换机端口,并确认子网配置。

②电缆的问题,有些交换机上连接有多台电脑,在不小心有物品挤压或是推搡的过程中可能会损害网络的插口,所以在有时发现计算机上不了网,连图标也没有的时候,可以先去观察下网络插口处的灯是否是亮的,然后再检查计算机与插口之间的电缆是否有断开或是破裂的痕迹,还要看看计算机电揽两边的接口是否松动。如果有适当的一点行动就可以使计算机恢复到上网的状态。一般情况下,端口故障是某一个或者几个端口损坏。所以,在排除了端口所连计算机的故障后,可以通过更换所连端口,来判断其是否损坏。遇到此类故障,可以在电源关闭后,用酒精棉球清洗端口。如果端口确实被损坏,那就只能更换端口了。

③有时候在网管进行网络配置和检查的时候会发生断网,可以尝试着用其他的计算机去连接到办公室线路,检查是否可以建立链路。如果大家都不可以,说明计算机主机端口可能被网管关闭,所以计算机才无法连接。还要检测下端口配置以确保端口可用且已按正确的VLAN进行配置。这样的问题只能与网管取得联系,请他打开端口并保持配置正常。

④交换机出现短暂的不能工作。因为交换机是由很多模块组成,任何一个模块如果发生了情况,哪怕是一些小问题,就有可能使得计算机出现大的损失。所以在正常情况下,注意在搬运交换机时千万小心,不能使之发生碰撞,然后在电源不稳定等情况下不能使用交换机等等,都能够有效的保护此类故障的不发生。

2.2 非常规问题

一般来说网络故障的情况都不会太严重,但是也有可能发生大的故障,以下我们可以来看下如何排除大的网络故障。

最大的故障可能就是遭遇入侵的问题,这是网管觉得最头痛的地方,也就是安全性故障。通常包括主机资源被盗、主机被黑客控制、主机系统不稳定等。通常情况下,攻击者可以通过这些进程的正常服务或漏洞攻击该主机,甚至得到管理员权限,进而对磁盘所有内容有任意复制和修改的权限。但是通常情况下,网管会发现此类故障的查找一般比较困难,一般可以通过监视主机的流量、扫描主机端口和服务、安装防火墙和加补系统补丁来防止可能的漏洞。举个例子,某公司突然发现网络经常不稳定,在网络不是很多人使用的时候出现了网络断掉的情况,一天有三十次之多,于是在网管的盘查下,发现是主机上带有病毒,才使得经掉线这种情况会出现。于是清除病毒,当然实际上这种情况比我们这里分析的要复杂的多,通常要通过一台台计算机的查询才能找到带毒的根源。

第二就是主机逻辑发生故障,主机逻辑故障所造成网络故障率是较高的,通常包括网卡的驱动程序安装不当、网卡设备有冲突、主机的网络地址参数设置不当、主机网络协议或服务安装不当和主机安全性故障等。在这种情况下,首先要去观察网卡的驱动程序是否安装不当。任何使得网络不兼容的情况都会导致网卡无法正常工作。在观测一下是否网卡设备有冲突。网卡设备与主机其它设备有冲突,会导致网卡无法工作。磁盘大多附有测试和设置网卡参数的程序,分别查验网卡设置的接头类型、IRQ、I/O端口地址等参数。若有冲突,只要重新设置(有些必须调整跳线),或者更换网卡插槽,让主机认为是新设备重新分配系统资源参数,一般都能使网络恢复正常。

3.网络故障诊断及排除

3.1 故障诊断步骤

第一步,首先确定故障的具体现象,分析造成这种故障现象的原因的类型。例如,主机不响应客户请求服务。可能的故障原因是主机配置问题、接口卡故障或路由器配置命令丢失等。

第二步,收集需要的用于帮助隔离可能故障原因的信息。从网络管理系统、协议分析跟踪、路由器诊断命令的输出报告或软件说明书中收集有用的信息。

第三步,根据收集到的情况考虑可能的故障原因,排除某些故障原因。例如,根据某些资料可以排除硬件故障,把注意力放在软件原因上。

第四步,根据最后的可能故障原因,建立一个诊断计划。开始仅用一个最可能的故障原因进行诊断活动,这样可以容易恢复到故障的原始状态。如果一次同时考虑多个故障原因,试图返回故障原始状态就困难多了。

第五步,执行诊断计划,认真做好每一步测试和观察,每改变一个参数都要确认其结果。分析结果确定问题是否解决,如果没有解决,继续下去,直到故障现象消失。

3.2 接口故障排除

路由器接口的典型故障问题是:带宽的过分利用;碰撞冲突次数频繁;使用不兼容的帧类型。使用show interface ethernet命令可以查看该接口的吞吐量、碰撞冲突、信息包丢失、和帧类型的有关内容等。

①通过查看接口的吞吐量可以检测网络的带宽利用状况。如果网络广播信息包的百分比很高,网络性能开始下降。光纤网转换到以太网段的信息包可能会淹没以太口。互联网发生这种情况可以采用优化接口的措施,即在以太接口使用no ip route-cache命令,禁用快速转换,并且调整缓冲区和保持队列的设置。

②两个接口试图同时传输信息包到以太电缆上时,将发生碰撞。以太网要求冲突次数很少,不同的网络要求是不同的,一般情况下发现冲突每秒有三五次就应该查找冲突的原因了。碰撞冲突产生拥塞,碰撞冲突的原因通常是由于敷设的电缆过长、过分利用、或者“聋”节点。以太网络在物理设计和敷设电缆系统管理方面应有所考虑,超规范敷设电缆可能引起更多的冲突发生。

③如果接口和线路协议报告运行状态,并且节点的物理连接都完好,可是不能通信。引起问题的原因也可能是两个节点使用了不兼容的帧类型。解决问题的办法是重新配置使用相同帧类型。如果要求使用不同帧类型的同一网络的两个设备互相通信,可以在路由器接口使用子接口,并为每个子接口指定不同的封装类型。

参考文献:

[1]梁西陈.计算机网络安全技术与管理措施[J].皖西学院学报,2007(05).

[2]陈积慧.高校局域网的组建过程[J].海南广播电视大学学报,2006(01).

篇5

故障1

关键词:电子稳定控制系统(VSES)

故障现象:一辆2010年产别克昂科雷运动型多功能车,行驶里程3万km,搭载3.6 L发动机和全时四驱系统。车辆在行驶过程中间歇性出现电子稳定控制系统(VSES)故障灯点亮。检查历史故障码,分别是:DTC U2100——控制器局域网(CAN)总线通信;DTC U2142——与横向偏摆率传感器(YRS)失去通信:DTCC0710——向盘位置信号:DTC C0186——横向加速计电路(有时);DTC C0196——横向偏摆率电路(有时)。

该车此前进行过2次维修:第1次来厂,VSES故障灯间歇点亮,清除故障码后试车,故障未再现,于是交车,但不久后故障灯又再次点亮。第2次进厂检修,维修人员调取故障码,与上次一样且都为历史码。通过检查发现2后轮在外更换过,大小与前轮不一致,怀疑这会影响车辆稳定控制系统工作,于是要求更换轮胎,更换轮胎后反复试车,故障未出现,于是再次将车交换客户。不幸的是,不久后车辆因此问题第3次进厂了。

检查分析:笔者接车后首先用专用诊断仪TECH2查看故障码,有以上故障码。通过分析故障码可以发现:首先故障是与网络通信有关,其次是出现网络故障的范围主要集中在底盘高速网络上(图1)。它们的信息是通过高速网络传递给其他控制单元及诊断接口DLC的6号和14号针脚(图2),电子制动控制单元(EBCM)同时处在这2个网络中。最后,底盘高速网络中转向盘位置信号、横向加速计信号以及横向偏摆率信号可作为突破口。查看TECH2数据,很快发现一个明显异常:“转向盘位置”一直为86°(图3)不动,正常情况下随着左右转动转向盘数值有正负值的变化。

是否因为这些信号出现异常影响到底盘高速网络,于是重点检查转向盘位置传感器线路,拆开转向盘位置传感器插接器测量:5号脚点火电压12V正常,6号脚搭铁良好。测试底盘高速CAN—H串行数据线3号和37号脚:2.5~3.5 V,CAN-L串行数据线2号和24号脚:1.5~2.5 V(无短路、断路)。断开EBCM控制单元插接器测量通断也是良好的,测试线路未见异常。

笔者决定更换转向盘位置传感器,进行对中学习后查看数据流:“转向盘位置”在-525°~+525°变化,完全正常。没有直接证据表明转向盘位置传感器存在故障,并且再次装回旧的转向盘位置传感器,数值变化也正常了。为防止再次返工,于是利用TECH2监控连续试车,重点捕捉颠簸路面试车数据。试车结束后仔细查看和比对捕捉的数据流,结合实际试车路况发现了异常:在转弯路口过一个较大减速带时,数据流中“转向盘位置”瞬间保持在53。不变,数据流中的“VSES失败”也由否变为是,但很快又恢复正常(图4)。虽然未能马上点亮故障灯,但已经足够表明故障依然未排除。

根据以上检查分析可能原因:线路因振动接触不良、短路或控制单元因振动出故障。故障又是间歇性出现,因简易程度及可能性下一步重点还是检测线路。为了验证这一假想且更直接地把故障再现出来,排查相关线路和控制单元的过程中,当一人用手晃动EBCM线束插接器,另一人边转方向边看TECH2内数据时,发现相关数据出现异常。严重时仪表中挡位信息也无显示,这是因为挡位信号是变速器控制单元(TCM)接收到挡位开关信号后,通过相关的CAN网络串行数据线送给仪表的,而因为CAN网络链中EBCM处出现异常,导致整个网络链中故障的出现。而其中“转向盘位置”信号也是因为类似原因导致故障。

故障排除:基本故障点已确认,处理EBCM线束插接器,分解端子注入导电胶并固定(图5)。反复试车、查看数据流及交车给客户使用故障末再出现,至此故障完全排除。

故障2:

关键词:偏摆及侧向加速度传感器控制单元

故障现象:一辆2011年产别克GL8豪华商务车,行驶里程6万km。因ABS故障灯亮、电子稳定系统故障灯亮进厂维修。读取故障码,有多个C类故障码:DTC C056D——电子控制单元硬件;DTC C0121——阀继电器电路故障;DTC C0800——控制模块电源回路等。还有网络通信故障:DTC U0121——发动机控制单元(ECM)与电子制动控制单元失去通信;DTC U0121——变速器控制单元(TCM)与电子制动控制单元失去通信:DTC U0140——ECM与车身控制单元失去通信;DTC U0100——车身控制单元(BCM)与发动机控制单元失去通信等多个u类故障码。EBCM有时用专用诊断仪GDS+MDI无法通信,于是更换EBCM,但更换后,尝试模块编程,不能成功进行(因为还是有时不能通信),还多了DTC C056E——电子控制单元软件(图6),并且故障依旧。

检查分析:笔者接车后了解到情况:更换EBCM前后DTC基本一样,之前维修人员更换EBCM依据是EBCM内的DTCC056D——电子控制单元硬件,维修手册对此故障码的说明是“硬件、内部故障、不涉及外部电路等”(图7),并且检查EBCM控制单元的电源、搭铁无异常。分析DTC又是有关网络通信的故障,范围也是缩小到底盘高速网络以及底盘高速网络中的主要控制单元EBCM有时不能通信。

笔者根据电路图(图8)先对这明显单一网络(也是双线高速一种)故障进行测量,通过诊断接口DLC的12及13号脚测量其网络静态终端电阻,约为60.1Ω(图9)正常;测试CAN-H和CAN-L线路的电压,无对搭铁或电源短路,也无开路。通过简单的以上测量可以说明在这个网络中连接线路通信是没问题的,于是接下来主要针对EBCM进行测量。

再次检查影响EBCM控制单元工作的电源、搭铁和唤醒线。查看EBCM内的数据流发现有异常:“系统电压”在0~11 V不停跳动,正常应是稳定的蓄电池电压,(图10中为8.27 V)。对照“防抱死制动系统电路图(控制单元电源、搭铁和子系统参考)”(图11)测量线路,电源1号脚、25号脚电压12 V且用试灯测试明亮,搭铁13号脚、38号脚与负极电阻为0.5 Ω正常,处理各搭铁点也未发现异常;EBCM控制单元启用的唤醒线35号脚,在休眠状态时为0 V,唤醒时为12 V,也非常正常;线插接器也未发现接触不良等异常现象。

是什么原因导致数据流中的电压不稳定,这应正是间歇产生U类码、诊断仪GDS+MDI无法通信的原因,但实际测试似乎相关电源和搭铁都没有问题。再次仔细阅读所有EBCM电路图,发现EBCM还为转向角传感器(B99)及偏摆及侧向加速度传感器(B119)提供电源及搭铁,16号脚为它俩提供搭铁,打开点火开关32号脚提供12 V电源(图12)。分别断开转向角传感器B99、偏摆及侧向加速度传感器B119插接器进行测试,结果搭铁线路正常,但电源线路2087在连接着B119测B99的电源时有异常,只有2.75 V且不稳定(图13);但连接着B99测B11g的电源就是正常的12 V。测量EBCM、B99和B11g问的12 V电源线2087无接触不良、短路等异常。恢复线路,但不连接B11g插接器,然后再次查看EBCM控制单元内数据“系统电压”为稳定的12 V电压,至此故障已基本明了。

故障排除:更换偏摆及侧向加速度传感器控制单元(B119),故障完全排除。由于EBCM、B99、B119是共用2087电路,B119传感器内部故障造成此电路电压不稳定,进而影响到EBCM的正常工作,相应的网络通信在此电路电压过低时就会出现中断。

回顾总结:车辆网络故障通常会有包括U类在内大量的故障码,面对大量的故障码和故障现象,可能会使人茫然,不知从何下手。对于处理此类故障我认为首先应通过诊断仪读取全车故障码,并分析维修方向:全车网络通讯故障;单个网络有通讯问题;只有一个控制单元问题。然后根据以上方向来制定具体检测方法。

(1)全车网络通讯情况都有问题的,主要检查诊断仪的连接状态、DLC(X84数据链路连接器)的针脚连接状态和电源及搭铁线路、DLC至网关BCM的连接线束及BCM本身状态、电源及搭铁等。

(2)单个网络无通讯主要是对该网络连接具体的测量。刚好这2个案例都是底盘高速网络出现问题,就此说明如下:首先要通过DLC测量高速网络静态终端电阻,正常值约为60Ω;其次测量CAN-H和CAN-L线路的电压,是否对搭铁或电源短路、是否开路等,如有必要可以用示波器去观察、对比故障车与正常车波形信号的差异(正常情况是CAN·H为2.5~3.5 V和CAN-L为1.5~2.5 V的方波信号),并加以分析判断。

(3)只有一个控制单元无通讯,首先查看相关电路图,然后考虑以下问题。

①网络通信线出现断路、短路或者信号电压异常。

②控制单元故障:控制单元电源、搭铁或控制单元内部故障。如故障2中所有的外部电源无任何问题,但网络中各元件问的电源线路同样须注意,否则就会产生像之前更换EBCM的误判。

③t唤醒线故障,因为控制单元如处在休眠状态,就谈不上通信了。

篇6

【关键词】网络故障 物理故障逻辑故障 维修方法

【中图分类号】TP393.01 【文献标识码】A 【文章编号】1672-5158(2013)04-0169-01

研究背景

计算机网络是由计算机各种软硬件和通信相关设备组成的系统,即利用各种通信手段,把空间上分散的计算机连在一起,达到相互通信而且共享软件、硬件和数据等资源的系统。随着计算机网络的发展,人们的生活得到了巨大的便利,但计算机网络的连接多样性、终端分布不均匀性和网络的开放性、互连性等特征,网络故障也越来越多,目前在各单位的网络中都存储着大量的信息资料,几乎所有是工作也依赖于网络,一旦网络被破坏造成信息的丢失将带来巨大损失。加强因此怎样解决网络故障是我们要面对和解决的重要问题,本文就是通过计算机网络故障进行分析并提出相应的对策,最后达到更好的运用计算机网络的目的。

常见网络故障

连通故障

连通故障又可以称为物理故障一般,即物理层中物理设备相互连接失败或者硬件及线路本身的问题:一是线路的连接故障,由于网线在使用过程中的损坏老化,或者接口处的松动等造成的网络连接故障。二是由于接口配置问题的物理故障,即由于接口的松动或者其他因素的损坏,使网线无法正常接入以及此类相关设备损坏导致故障。三是网卡的物理故障,主要是指由于网卡松动,使网络连接失效。

逻辑故障的种类

计算机网络的逻辑故障又称软件故障,主要是指软件安装或网络设备配置错误所引起的网络异常,其中最常见的是网络设备配置错误。逻辑故障与连接故障相比复杂得多。常见的网络逻辑故障有:主机逻辑故障、进程或端口故障、路由器逻辑故障等。主机逻辑故障通常包括网卡驱动程序、网络通信协议安装错误、网络地址参数配置不正确等。进程或端口故障是指进程或端口由于受到病毒或系统的影响而无法启动。路由器逻辑故障是指因为端口的配置错误而导致的网络故障,如路由器CPU利用率高和路由器内存余量太小以及SNMP进程意外关闭而造成的故障。另外网络地址的安全问题,也是计算机网络故障之一。网络用的TCP/IP协议本身就是一种安全风险,大量重要程序都以TCP为传输层协议,因此TCP的安全性问题会给网络带来严重的后果。四是网络结构的安全问题。互联网由无数个局域网组成,通常情况下计算机之间互相传送的数据流要经过重重转发,因此,攻击者只要接入任一节点就可以捕获所有数据包从而窃取关键信息。

计算机网络安全的相关技术

虽然计算机网络面临着诸多的安全问题,但是目前已有比较成熟的网络安全技术,包括防病毒软件、防火墙、入侵检测、安全扫描等多个安全组件组成,主要有防火墙技术、数据加密技术、入侵检测技术、防病毒技术等。

防火墙技术:

“防火墙”既可以阻止外界对内部网络资源的非法访问同时也可以防止系统内部对外部系统的不安全访问,其主要技术包括:数据包过滤、应用级网关、服务和地址转换。

数据加密技术:

加密的目的是保护网络节点之间的链路信息安全,可以进行数据加密、身份鉴别、访问控制、数字签名、数据完整性验证、版权保护等,用户可根据网络情况选择对称密钥密码体制和非对称密钥密码技术等不同的加密方式。信息加密过程操作简单,但是意义重大,在多数情况下,信息加密是保证信息机密性的唯一方法。

入侵检测技术:

分别基于网络和基于主机。由于网络的入侵检测系统主要采用被动方法收集网络上的数据。目前,在实际环境中应用较多的是基于主机的入侵检测系统,它可以不受网络协议、速率和加密的影响直接针对主机和内部的信息系统同时还具有检查木马等功能。

防病毒技术:

网络防病毒软件则主要注重网络防病毒。尝试利用360安全卫士等具有杀毒和软件修复功能的浏览器或Firefox浏览器,可以清除病毒,防止病毒软件对计算机网络系统的破坏。

安全对策以及维护方法

对计算机网络的维护包括对硬件的维护和对软件的维护。对硬件的维护包括检测联网电脑网卡、网线、集线器、交换机、路由器等故障、计算机硬盘、内存、显示器的维护。首先要仔细检查计算机网卡是否运行正常,检查网线以及网卡指示灯,如果出现故障,应及时更换网线,集成器等部件。检查网络插口股,在网络连接过程中,会因为物品挤压以及不小心造成的损坏,以及接口处的松动,而导致计算机无法联网,此时应对计算机与插口间的电缆线进行检查。利用测线仪等工具测试网线、接口、网卡以及交换机端口是否正常。对由于路由器配置错误会导致的故障,方法就是重新配置路由器端口的静态路。如果是由,只有对路由器进行升级、扩大内存。

对计算机软件的维护包括计算机网络设置的维护,对网络安全l生的检测,以及对网络通畅性的检测。多为浏览器本身故障或被恶意软件篡改破坏,导致无法浏览网页,对网络设置的维护。首先,检查Ping线路近端的端口是否处于关闭的状态,若是因为端口处于关闭状态,只需重新启动该端口即可。检查lP地址,TCP/IP选项参数是否正确,当所填参数有误时,可以通过lP地址,TCP/IP选项参数进行修改核对。对网络安全性的维护包括安装杀毒软件,经常性的进行查杀毒处理,安装的防火墙,设置高密的防治网络安全入侵的加密处理,定期的对网络加密设置进行更新。例如及时查杀病毒并,避免使用非正规的磁盘,不要打开垃圾邮件,不要随意点击非法网站。

篇7

网络故障管理是网络管理的一个重要组成部分。故障管理的有效与否和功能强弱直接关系到被管理网络的可用性和可靠性。传统的基于SNMP的网络故障管理模型是以Client/ Server 技术为核心的集中故障管理方式。它通过不断轮询被管对象 Agents (Servers) 和接收 Agents 的报告(Trap)两种机制获得故障信息。该机制主要存在两个方面的问题:(1) 缺乏灵活性、可扩展性和本地处理能力,难以适应现代网络的故障管理的需要;(2)冗余信息过多,网络管理效率低下。

解决以上问题的基本思想是使管理智能和移动性尽可能地靠近被管设备资源。移动Agent本质上是一种可以从异构网络环境中的一台主机移动到另一台主机并可与其它Agent或资源交互的软件实体。因此,移动Agent成为网络故障管理的理想选择。故障检测在故障管理中具有重要的地位,本文提出了一种基于移动Agent的故障检测系统。

2 移动Agent简介

软件Agent是运行于动态环境的、具有高度自治能力的实体,它能够接受其它实体的委托并为之服务。移动Agent是一类特殊的软件Agent,它除了具有软件Agent的基本特性――自治性、响应性、主动性和智能性外,还具有移动性,即它可以在网络上从一台主机自主地移动到另一台主机,代表用户完成指定的任务。虽然目前不同移动Agent系统的体系结构各不相同,但几乎所有的移动Agent系统都包含移动Agent(简称MA)和移动Agent服务设施(简称MAE)两个部分。

移动Agent是一个全新的概念,虽然目前还没有统一的定义,但它至少具有如下一些基本特征:

身份唯一性

移动Agent必须具有特定的身份,能够代表用户的意愿。

移动自主性

移动Agent必须可以自主地从一个节点移动到另一个节点,这是移动Agent最基本的特征,也是它区别与其他Agent的标志。

运行连续性

移动Agent必须能够在不同的地址空间中连续运行,即保持运行的连续性。具体说来就是当移动Agent转移到另一节点上运行时,其状态必须是在上一节点挂起时那一刻的状态。

3 基于移动Agent的网络故障检测体系结构

故障检测是故障管理的基础,目前对数据包的监测是获取有关节点、应用程序和故障类型等信息的最有效的方法。在传统的集中式的检测模式中,大量的无用数据包发送到管理器。这种无用的数据包大大增加了网络管理器的负担。另外,由于所有的故障判定都是由网络管理器完成的,对于实时性较强的故障有时就很难检测,因为它不能在本地进行处理,必须送到网络管理站之后才能进行判定。

为了解决这些问题,我们将移动Agent技术引入到故障检测中。它能够提高网络故障检测的灵活性和分布性。对于集中式模式的信息交换,管理器可以将多个能完成特定任务的移动Agent发送到需要任务处理的设备上,这些Agent能够从一个节点移动到另一个节点。这样,平时许多原始的管理信息可以就地处理,这就大大减轻了网管平台的开销。

3.1 基于移动Agent的网络检测系统模型

基于移动Agent的网络检测系统模型如图1所示,模型由网络管理工作站、MA和具有移动Agent执行环境(MAE)的被管理节点这3个部分组成。网络管理站根据管理任务生成并派遣移动Agent,处理它所返回的数据。移动Agent可以按照管理站预先规定的路线和策略在各被管节点间迁移并收集数据和进行网络管理操作。被管理节点上存在移动Agent执行环境,执行环境接受移动Agent并且提供对本地资源的访问。网络管理站根据不同的管理任务,派遣相应的移动Agent到各个被管理节点执行管理任务。这些移动Agent在每一个被管理节点完成管理任务后携带相关的信息返回管理站,或者依次迁移到多个被管理节点,分别完成相应的管理任务后返回管理站。

由移动Agent来实现故障检测具体包含以下步骤:

(1) 给移动Agent加载实现故障检测所需的智能,此过程又称为功能委托。

(2) 移动Agent按照它的通信特性与管理者互相作用。此过程的主要目的是从管理者收到的消息中获得相关状况的本地信息。

(3) 移动Agent过滤掉告警中重复发生的告警,并将余下告警代替与某一特殊模式相匹配的一系列告警和一个新的告警相互关联。随后,移动Agent完全自主地移动到产生告警的网元。这一过程充分体现了Agent自治性和智能性的本质。

3.2被管节点(网元)结构模型

移动Agent执行环境(MAE)是支持Agent系统的关键部分,移动Agent与系统的交互、网管操作的完成以及对本地资源的访问均由它来控制和支持,它包括认证服务、资源管理和通信模块。

在简单网络管理协议(SNMP)中,管理应用与SNMP进行通信来完成各种网管操作。我们保留了传统网管系统对网元的成熟技术(数据采集技术),设计移动Agent(MA)与SNMP的交互接口。

在基于移动Agent的网络管理中,我们希望Agent实现其完备的自主性和自学习性,实现其真正的智能化,即对于那些曾经成功处理过的案例将被记录下来,在下次遇到此类故障时,Agent就可以直接从策略库中提取出来进行处理。因此我们设计了处理策略数据库。

4 仿真实验和数据分析

为了对系统的性能进行测试,我们在局域网上进行了实验。此局域网是由10个节点组成的以太网。管理站配置为P4 2.8G Hz CPU和1G Ram,操作系统为windows2000 Advanced Server,100Mbit/s带宽接入局域网;其他节点配置为P4 750M Hz CPU和512M Ram,操作系统为windows 2000 professor ,我们采用将部分节点仿真为路由器,每个节点的网络带宽缺省为l0Mbit/s,每条链路的带宽变化服从均值为8Mbit/s的高斯分布。

为了测试系统对网络故障的检测能力,我们与传统的SNMP网络检测的性能进行了比较。两个系统设置合适的过滤器,以获得事件信息用来捕获数据包,两个系统都分析了捕获的数据流量,识别出故障特征。实验结果如图3所示。

从图中可以看出,采用传统的SNMP网络故障检测带来的网络流量要远大于基于移动Agent结构的网络故障检测产生的流量。

5 结束语

本文提出的基于移动Agent的网络故障检测是一种新型的故障检测方法,它摒弃了传统的网络检测中管理站在某一位置的固定处理方式,利用了移动Agent的智能性、移动性和自主性优点,从而减轻了管理站的计算负载,同时还提升了网络检测系统的主动性、灵活性和重构性。移动Agent的迁移策略和安全性问题,包括移动Agent的合法性验证和携带数据的保护是我们下一步的研究目标。

参考文献

[1]杨家海,任宪坤,王沛瑜.网络管理原理和实现技术[M].北京:清华大学出版社,2000.

[2]李治文,孟洛新,元峰.网络管理环境下移动技术应用研究的现状、问题与展望[J].电子学报,2002,30(4):564-569.

[3]周伟,王汝传,徐小龙.基于移动的网络故障管理的研究[J].微型机与应用,2004,(2):29-32.

[4]陈志,王汝传.基于移动的网络故障管理模型的研究[J].通信技术,2004,2 85-86,98.

篇8

关键词:网络 故障 排除

0 引言

如今因特网是极其庞大和复杂的,尽管其形式和内容都在发生巨大的变化,但是网络在初期设计和建造中,都采用分层次的结构,这种体系结构使得各种不同硬件和软件快速连接到网络,网管员在分析和排查网络故障时可充分利用这种分层结构,快速准确的定位并排除故障,达到事半功倍的效果,本文就对如何分层排除网络故障作以介绍。

1 系统化排错策略

网络故障排除是一门综合性技术,涉及到网络技术的方方面面,所以当听到“网络瘫痪了”,对于网络管理员来说,首先应该是镇定,其次开始第一步,分析网络故障时,首先要清楚故障现象,应该详细说明故障的现象和潜在的原因,然后确定造成这种故障现象的原因的类型。例如,主机不响应客户请求服务。可能的故障原因是主机配置问题、接口卡故障或路由器配置命令丢失等。第二步,收集需要用于帮助隔离可能故障原因的信息,如向用户、网络管理员、管理者和其他关键人物提一些和故障有关的问题。广泛的从网络管理系统、协议分析跟踪、路由器诊断命令的输出报告或软件说明书中收集有用的信息。第三步,根据收集到的情况考虑可能的故障原因。可以根据有关情况排除某些故障原因。例如,根据某些资料可以排除硬件故障,把注意力放软件原因上。对于任何机会都应该设法减少可能的故障原因,以至于尽快的策划出有效的故障诊断计划。第四步,根据最后的可能的故障原因,建立一个诊断计划,开始仅用一个最可能的故障原因进行诊断活动,这样可以容易恢复到故障的原始状态。如果一次同时考虑一个以上的故障原因,试图返回故障原始状态就困难的多了。第五步,执行诊断计划,认真做好每一步测试和观察,直到故障症状消失。第六步,每改变一个参数都要确认其结果。分析结果确定问题是否解决,如果没有解决,继续下去,直到解决。网络故障的发生时很常见的事情,而对于网络管理员来说,就是去解决这种网络故障,恢复网络运行,改善和优化网络的性能。因此部署一种能够排除不同可能性并一步一步朝网络问题的真实原因前进的技术方案是非常关键的步骤,一个较好的故障排查方案图如下:

2 分层排错

网络的故障到底出在什么地方?这对于很多初级网络管理者来说是一件麻烦的事情,但是对于网络来说,为了降低设计的复杂性,增强通用性和兼容性,计算机网络都设计成层次结构。这种分层体系使多种不同硬件系统和软件系统能够方便地连接到网络。管理员在分析和排查网络故障时,应充分利用网络这种分层的特点,即根据OSI七层结构的定义和功能逐一的分析和排查这是最好最快的方法。OSI的层次结构为管理员分析和排查故障提供了非常好的组织方式,由于各层相对独立,按层排查能够有效地发现和隔离故障,因而一般使用逐层分析和排查的方法。在应用分层思想的可以有不同的思路,可以采用自下而上的方法,也可以采用自上而下的方法,自下而上是指从物理层开始检查直到应用层;自上而下是指从应用协议中捕捉数据,分析数组统计数据和流量统计信息以获得有价值的信息。OSI把网络分成了七层,从下至上(1层到7层)分别为物理层、数据链路层、网络层、传输层、会话层、表示层、应用层,这七层模型描述了信息如何通过网络介质从一台计算机的软件应用传输给另一台计算机的软件应用,这七个层次相对独立,完成相应的网络功能。OSI的上层(5至7层)处理应用问题,并且通常只实现在软件中。应用层最靠近终端用户。OSI的下层(1至4层)处理数据传输问题。物理层和数据链路层实现在硬件和软件中。网络层和传输层一般只实现在软件中。①在查看物理层时,此时应该做的第一件事情就是检查网络线路。计算机后面的网卡绿色指示灯是否亮?很多情况下,你会发现这仅仅是线路存在问题。你可能也遇到过比较罕见的情况,由于线路接口比较松,加上用户的经验不足,所以看上去是插着的,但实际上并没有接触。因此应注意连接电缆是否正确,Modem、CSU/DSU等设备的配置及操作是否正确,确定路由器、交换机、防火墙等设备接口是否完好的主要通过show interface命令,检查每个端口是否UP,查看传输模式、传输速度、协议建立状态等。②在确保物理层完好的情况下,应特别注意数据链路层,因为所有网络层及网络层以上的应用都建立在数据链路层的正常工作。数据链路层主要关注于相连设备的互连参数,比如封装协议、信令格式等。③网络层是计算机通信的关键层,因此网络层检查时要注意利用Ping命令和Traceroute命令检查网络的连通性。网络层提供建立、保持和释放网络层连接的手段,包括路由选择、流量控制、传输确认、中断、差错及故障恢复等。排除网络层故障的基本方法是:沿着从源到目标的路径,查看路由器路由表,同时检查路由器接口的IP地址。如果路由没有在路由表中出现,应该通过检查来确定是否已经输入适当的静态路由、默认路由或者动态路由。然后手工配置一些丢失的路由,或者排除一些动态路由选择过程的故障,包括RIP或者IGRP路由协议出现的故障。④在协议层的高层涉及到协议故障比较多,故障处理起来越来越困难,因此管理员需要懂得协议之间如何工作。首先管理员应清楚有那些程序可用,可以利用Telnet终端模拟应用程序,它可以提供对大型主机、UNIX系统、路由器、交换机等的应用程序和相关配置的命令行访问方式。同时可以使用端口扫描器判断哪些端口正在使用,以及借助协议分析仪(如微软提供的网络监视器)捕捉相应的RIP信息和UDP报头,大多数传输层错误主要表现在ACL和NAT上面。另外日志对于网络安全来说非常重要,记录了系统每天发生的各种各样的事情,你可以通过日志来检查错误发生的原因,或者受到攻击时攻击者留下的痕迹。路由器的一些重要信息可以通过syslog机制在内部网络的Unix主机上作日志。在路由器运行过程中,路由器会向日志主机发送包括链路建立失败信息、包过滤信息等等日志信息,通过登录到日志主机,网络管理员可以了解日志事件,对日志文件进行分析,可以帮助管理员进行故障定位、故障排除和网络安全管理。当网络故障排除后,管理员应及时做好记录,以便日后查看和使用。⑤而对于应用层来说,可以使用程序本身进行调试和排错。

3 总结

企业网络是个复杂而庞大的体系,任何一个细小的错误都可能导致整个网络的瘫痪,对于网络管理员来说,要从故障现象出发,以各种手段收集更可能多的信息,确定故障点,制定各种排错的计划并执行,直至排除故障。随着计算机网络体系的不断壮大,也会越来越复杂,但是万变不离其宗,那就是按照分层次结构去排查,同时将所掌握的知识有条理的系统的方式应用到诊断和排除网络故障中去,就可以达到事半功倍的效果。

参考文献

[1]秦东.企业网络故障.电子工业出版社.2007.6.1.

篇9

Abstract: With the development of the times, the computer network is becoming more and more porpular ,network various faults also emerge as the times require. According to the practical case, this paper makes a preliminary discussion on how to handle network failures,which has certain help to network maintenance staff.

关键词: 网络;故障处理;实际案例

Key words: network;fault processing;typical case

中图分类号:TP31 文献标识码:A 文章编号:1006-4311(2013)08-0183-02

0 引言

在信息化快速发展的今天,网络已经渗透到社会生活的各个领域,已经成为人们日常工作和交际中的重要组成部分。而随着网络重要性的日益凸显,网络的安全高效运行更加重要。这就要求网络维护人员在网络出现异常时,尽快查明故障点,及时消除故障,确保网络的顺利运行。

1 具体案例分析计算机网络故障

那么当我们真正遇到一个故障时,应该怎么做呢?下面通过具体的案例来与大家探讨。

1.1 案例一 当遇到一个实际的网络故障时,应该根据网络拓扑结构,首先查明物理链路是否畅通,最简单的办法就是先登到客户端设备上,进行最基本的三步骤,首先PING一下两端地址,看两端地址是否能够互PING成功,如果两端地址互PING成功,则说明线路没有问题。如果无法PING通对端地址。接着使用Tracert命令,来显示数据包到达目标主机所走的全部路径、节点的IP以及花费的时间都显示出来。看看到哪个节点,数据包通不过去,从而判断故障点具置。进而根据实际情况定制解决方案处理具体故障。从Tracert到的故障IP地址,查出具体的故障设备,进而再一步步查明原因,循序解决。

1.1.1 实际案例:

故障描述:客户A到客户P端核心路由器FTTP文件无法正常传送。

故障现象:各分支节点客户B,C,D到客户A无法发送FTTP文件,客户A内部局域网设备a,b,c,d不能互相发送FTTP文件。

处理步骤及分析原因:

①本网络的拓扑结构如图1所示。从客户A到核心客户端p两端互PING,网络收发包正常。从客户p端网管可直接登录客户A端路由器正常,从客户A端设备可以正常登录核心客户端主页地址。判断网络线路正常,(此处由于两端互PING正常,所以不用再使用TRACERT命令来具体分析故障节点),分析判断所经设备配置故障。

②查客户p端核心路由器配置,客户B端核心路由器配置针对客户A已开通FTTP协议。查客户A端路由器,客户A端路由器FTTP协议开通。判断为两端防火墙配置原因。

③断开客户A客户端防火墙,重新发送FTTP文件进行验证。客户端防火强断开后,客户A内部局域网可以正常互发FTTP文件,但是各分支点到客户A依然不能正常发送FTTP文件。查客户p端核心路由器前所置防火墙配置,FTTP协议配置正常。但是从客户p端终端设备无法登录客户A的FTTP文件服务器。决定甩开客户p端防火墙,验证是否可以正常登录客户A的FTTP文件服务器。

④甩开客户p端防火墙后,从客户p可以正常登录客户A端的FTTP文件服务器,判断故障原因依然是核心客户p端防火墙原因,将备用防火墙替换主用防火墙后,依然不能正常收发FTTP文件;查备用防火墙数据配置,发现备用防火墙未开通FTTP文件协议,开通备用防火墙FTTP协议,从核心客户p端可以正常登录客户A端的FTTP服务器。在客户A端试收发FTTP文件,收发正常。判断主用防火墙坏。

⑤两端防火墙都重新配置FTTP协议后,各分支点到客户A端收发FTTP文件正常,客户A内部互相发送FTTP文件正常。

1.1.2 案例总结:

FTTP文件不能正常发送应从如下原因分析:①网络物理链路故障;②中间设备故障;③网络中间所经设备配置错误;

在网络维护中,善于总结,善于搜集案例,也是提高网络维护水平的重要步骤。当我们每次处理完一个故障,不能简单的处理完了就不管了,我们还要做好后续的总结分析工作,将遇到的障碍处理过程及处理中遇到的难点和疑点及问题记录并总结,为今后的维护工作搜集材料,以便在随后的障碍处理中少走弯路,缩短处理时间奠定基础。

1.2 案例二 在具体处理故障过程中,应根据实际情况仔细甄别,不能盲目判断。

1.2.1 实际案例:

故障描述:两次掉电后某市直单位无法正常登录省级核心主页。

故障现象:该市直单位客户端NE40的16口以太网板RUN灯不亮,内部网络全部中断。

处理步骤及分析原因:

篇10

关键词:计算机机房;维护;网络故障

中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2012)33-7891-02

校园机房是学校进行计算机专业教学、多媒体学科教学及考试的重要教学场所和教学工具,机房的运行情况直接影响学校的教育教学工作。为保证教学工作的顺利进行,机房的维护和网络故障排除极其重要。

1 校园机房维护的意义和结构

校园机房维护是指对学院计算机机房及设备的管理和养护,是对整个机房电子教学系统的一种保养。科学合理的机房维护可以保证机器的正常运行、优化计算机的性能、提高计算机使用者的工作效率、教学效率和学习效率。机房缺乏维护将会影响机器的正常运行,可能造成配件损坏或硬盘数据丢失,甚至是整个计算机机房系统的崩溃,严重影响学校的正常教学秩序。计算机机房的维护包括的外部环境、计算机单机、网络三个方面。计算机机房维护结构如图1所示:

图1 计算机机房维护结构图

2 机房环境的维护

计算机机房放置的计算机、网络设备等电子设备易受环境条件、人为因素的影响。合适安全的机房环境包括以下几个方面。

1)自然环境

计算机机房应安装空调,温度控制在15~35 ℃,以保证计算机正常运行时所需的环境温度。机房应保持通风良好,房间的相对湿度在20%-80%之间,有条件可以安装通风设备、湿度调节设备。保持机房的干净清洁,定期整理机箱内部的卫生。

2)电源

机房的用电设备密集,包括计算机、网络设备、空调等,首先要保证用电安全,其次应配备稳压器,保证机器工作所需的稳定电源,配备不间断供电电源UPS,防止突然断电,造成系统数据破坏。

3)防止干扰

机房内部及附近要避免干扰。主要是避免电磁波干扰、静电干扰、振动和噪音干扰。计算机正在工作时,应避免附近存在强电设备的开关动作;避免使用电炉、电视或其它强电设备;防止用户带静电接触计算机的配件;防止较强的噪音和振动。

4)正确操作

计算机使用者是机房环境的一部分,用户是否正确的进行计算机操作将直接影响计算机的性能,错误的操作如开机顺序错误、开关机间隔时间不够、非法关机等,容易造成系统损害,甚至造成物理伤害。

5)建立健全计算机机房各项规章制度,明确管理职责,执行上机登记制度,遵守计算机机房开放时间,严禁带食物与饮料进入机房等。

3 计算机单机的维护

对每台计算机单机建立档案,包括计算机的配置信息,上机情况登记,维修记录等。

3.1 硬件维护

计算机硬件的维护主要是主机主要部件的维护。使用主板时,插拔外部接口部件或主板上各板卡时注意垂直插拔,不要用力过猛,否则可能造成板卡变形、接口损坏,甚至是主板线路板的断裂、元器件脱落等故障。使用CPU时要注意防高温、防震动,一般不要超频。对于内存条,要定期用橡皮或酒精擦拭清洗,避免内存条金手指氧化造成接触不良。机器尽量放在平稳的地方,少搬动。尤其是硬盘在工作时盘片高速旋转,不要移动机箱,其次要做好硬盘的散热。

3.2 软件维护

计算机维护,主要是对计算机软件和数据的维护。

1)系统软件

及时备份系统、进行系统维护、修复系统漏洞,必要时可以还原系统或重装系统。对有特殊要求的机房可是设置为每次重启自动还原,可以是软件还原也可以用还原卡还原。

2)应用软件

最重要的软件是电子教室,其他应用软件可根据教学的需要进行安装。选择软件注重够用、实用的原则。对于同一功能的软件,不要重复安装,节约系统资源,避免软件冲突。应用软件的使用过程中要及时打补丁或下载某些插件。

3)数据整理

随时或定期做好机房数据的整理、备份工作。即防止硬盘中冗余数据影响计算机性能,又避免系统软件或硬件的损坏而导致数据丢失。

4)防毒和杀毒

安装正版的反病毒软件并进行设置,确保使用前先查病毒,及时对反病毒软件进行升级。及时查杀病毒,以免感染、直接或间接传播病毒,危害网络上其他机器的安全和网络的运行。

4 网络故障排除

计算机房的网络是否连通决定了电子教室软件的使用,决定了是否能顺利的完成教学工作。校园计算机机房一般是由计算机、网卡、网线、网络设备等组成的局域网。局域网的网络故障主要是指计算机之间不能相互连通,网络故障的判断可以通过网络命令如Ping、Ipconfig命令、查看设备管理器、使用测试仪器等方法确定,常见的机房故障及排除方法见表1。

表1 常见网络故障排除

[故障原因\&故障现象\&排除故障的方法\&连接故障\&网卡、网线、集线器、路由器等设备之间连接松动或错误\&正确连接个部件\&网络设置\&资源冲突,IP冲突、禁用网络等\&正确配置计算机网络\&驱动故障\&网卡驱动程序不正常\&重装驱动程序\&硬件故障\&网卡、网线、水晶头或集线器等设备故障\&更换发生硬件故障的部件\&]

根据网络故障的严重程度可初略判断故障原因和大概位置,然后遵循“先软件后硬件,先本机后网络”的原则,逐步检查并排除网络故障。

5 结束语

加强对机房设备的维护,及时排除机房的网络故障,可以提高机房计算机的使用效率,提升使用者的学习效率,确保机房教学工作的顺利开展。

参考文献:

[1] 田啸.局域网组建与维护[M].北京:人民邮电出版社,2001.