未来教育家杂志封面

国际刊号:ISSN2095-4514

国内刊号:CN 10-1044/G4

邮发代号:80-572

主管:教育部

主办:中国教育学会

《未来教育家》杂志社编辑出版

联系我们

投稿邮箱:wljyjqk@.163.com

网    址:www.wljyj.com

浅析计算机网络故障处理技术 杨新宇

浅析计算机网络故障处理技术

武警辽宁总队司令部 杨新宇

 

摘 要:本文主要阐述了计算机网络故障的常见问题及解决网络故障的处理流程,以及故障现象的具体体现及产生故障的可能原因,并且介绍了一些常见的故障处理命令以及处理故障的常用方法。
  关键词:网络故障  常用工具 处理方法
  当今的网络互连环境是复杂的,而且其复杂性还在日益增长,主要体现在现代的因特网络要求支持更广泛的应用,包括数据、语音、视频及它们的集成传输;并且新业务发展使网络带宽的需求不断增长,这就要求新技术的不断出现。例如:十兆以太网向百兆、千兆以太网的演进;MPLS技术的出现;提供QoS能力等。同时新技术的应用还要兼顾传统的技术。例如,传统的SNA体系结构仍在某些场合使用,DLSw作为通过TCP/IP承载SNA的一种技术而被应用。这个时候能够正确地维护网络尽量不出现故障,并确保出现故障之后能够迅速、准确地定位问题并排除故障,对网络维护人员来说是个挑战。这不但要求对网络协议和技术有着深入的理解,更重要的是要建立一个系统化的故障处理思想并合理应用于实际中,以将一个复杂的问题隔离、分解或缩减排错范围,从而及时修复网络故障。

一、网络故障的一般分类

网络故障的常见分类为物理故障和逻辑故障,但我们这里主要从连通性问题与性能问题进行区分。

连通性问题包括硬件故障,媒介故障、电源故障等等,主要有以下几种表现形式,(1)电脑无法登录到服务器;(2)电脑无法通过局域网接入Internet;(3)电脑在“网上邻居”中只能看到自己,而看不到其他电脑,从而无法使用其他电脑上的共享资源和共享打印机;(4)电脑无法在网络内实现访问其他电脑上的资源;(5)网络中的部分电脑运行速度异常的缓慢。主要是以下几种原因可能导致连通性故障:(1)网卡未安装,或未安装正确,或与其他设备有冲突;(2)网卡硬件故障;(3)网络协议未安装,或设置不正确;(4)网线、跳线或信息插座故障;(5)Hub电源未打开,Hub硬件故障,或Hub端口硬件故障; (6)UPS电源故障。同时也包括计算机或是网络设备的配置错误,或是不正确的相互作用。

性能问题包括的因素较多,包括网络拥塞、供电不足、路由环路、路由器到目的地不是最佳路由等等。其中网络拥塞是指在分组交换网络中传送分组的数目太多时,由于存储转发节点的资源有限而造成网络传输性能下降的情况。路由环路主要是指在维护路由表信息的时候,如果在拓扑发生改变后,网络收敛缓慢产生了不协调或者矛盾的路由选择条目,就会发生路由环路的问题,这种条件下,路由器对无法到达的网络路由不予理睬,导致用户的数据包不停在网络上循环发送,最终造成网络资源的严重浪费。

二、网络故障的解决步骤

故障处理系统化是合理地一步一步找出故障原因并解决的总体原则。它的基本思想是系统地将由故障可能的原因所构成的一个大集合缩减(或隔离)成几个小的子集,从而使问题的复杂度迅速下降。该处理流程是网络维护人员所能够采用的排错模型中的一种,如果你根据自己的经验和实践总结了另外的排错模型并证明是行之有效的,可以继续使用它,网络故障解决的处理流程是可以变化的,但故障处理有序化的思维模式是不可变化的。

在我们排除故障时,首先要识别故障现象,识别故障现象时,应该向操作者询问以下几个问题:(1)当被记录的故障现象发生时,正在运行什么进程(即操作者正在对电脑进行什么操作);(2)这个进程以前运行过吗?(3)以前这个进程的运行是否成功?(4)这个进程最后一次成功运行是什么时候?(5)从那时起,哪些发生了改变?  带着这些疑问来了解问题,才能对症下药排除故障。其次是对故障现象进行详细描述,当处理由操作员报告的问题时,对故障现象的详细描述显得尤为重要。如果仅凭他们的一面之词,有时还很难下结论,这时就需要管理员亲自操作一下刚才出错的程序,并注意出错信息。例如,在使用Web浏览器进行浏览时,无论键入哪个网站都返回“该页无法显示”之类的信息。使用ping命令时,无论ping哪个IP地址都显示超时连接信息等。诸如此类的出错消息会为缩小问题范围提供许多有价值的信息。对此在排除故障前,可以按以下步骤执行:  (1)收集有关故障现象的信息;(2)对问题和故障现象进行详细描述;  (3)注意细节;(4)把所有的问题都记下来;(5)不要匆忙下结论。

三、网络常见论断工具介绍

(一)命令ping用于检查IP网络连接及主机是否可达。“ping”这个词源于声纳定位操作,指来自声纳设备的脉冲信号。ping命令的思想与发出一个短促的雷达波,通过收集回波来判断目标很相似;即源站点向目的站点发出一个ICMP Echo Request报文,目的站点收到该报文后回一个ICMP Echo Reply报文,这样就验证了两个节点间IP层的可达性--表示了网络层是连通的。

在PC机上ping命令的格式如下:

ping [ -n  number ] [ -t  ] [ -l  number ]  ip-address

-n   ping报文的个数,缺省值为5;

-t   持续地ping 直到人为地中断,Ctr+Breack暂时中止ping命令并查看当前的统计结果,而Ctr+C则中断命令的执行。

-l   设置ping报文所携带的数据部分的字节数,设置范围从0至65500。

(二)tracert 命令用于测试数据报文从发送主机到目的地所经过的网关,主要用于检查网络连接是否可达,以及分析网络什么地方发生了故障。 tracert利用IP报文的TTL域在每经过一个路由器的转发后减一,当TTL=0时则向源节点报告TTL超时这个的特性。tracert首先发送一个TTL为1的UDP报文,因此第一跳发送回一个ICMP错误消息以指明此数据报不能被发送(因为TTL超时),之后tracert再发送一个TTL为2的报文,同样第二跳返回TTL超时,这个过程不断进行,直到到达目的地,此时由于数据报中使用了无效的端口号(缺省为33434)此时目的主机会返回一个ICMP的目的地不可达消息,表明该tracert操作结束。tracert记录下每一个ICMP TTL超时消息的源地址,从而提供给用户报文到达目的地所经过的网关IP地址。

在PC机tracert命令的格式如下:

tracert [ -d ] [ -h maximum_hops ] [ -j host-list ] [ -w timeout ] host

-d   不解析主机名;

-h   指定最大TTL大小;

-j    设定松散源地址路由列表;

-w  用于设置UDP报文的超时时间,单位毫秒;

(三)display命令是用于了解路由器的当前状况、检测相邻路由器、从总体上监控网络、隔离因特网络中故障的最重要的工具之一。几乎在任何故障处理和监控场合,display命令都是必不可少的。该命令将帮助用户收集下列信息:VRP软件版本、是哪一系列的路由器、设备运行时间、处理器的信息、RAM的容量、配置寄存器的设置、固件的版本等等。

四、故障处理常用方法

(一)分层故障处理法

分层法思想很简单:所有模型都遵循相同的基本前提--当模型的所有低层结构工作正常时,它的高层结构才能正常工作。在确信所有低层结构都正常运行之前,解决高层结构问题完全是浪费时间。

(二)分块故障处理法

我们以Quidway系列路由器为例,其current-configuration文件的组织结构,是以全局配置、物理接口配置、逻辑接口配置、路由配置等方式编排的。我们可以以此作为故障定位提供了一个原始框架,当出现一个故障案例现象时,我们可以把它归入上述某一类或某几类中,从而有助于缩减故障定位范围。

(三)分段故障处理法

如果两个路由器跨越电信部门提供的线路而不能相互通信时,分段故障处理法是有效的,我们主要从以下6段进行排查,主机到路由器LAN接口为一段,路由器到CSU/DSU接口为一段,CSU/DSU到电信部门接口为一段,WAN电路为一段,CSU/DSU本身问题为一段,路由器本身问题为一段。

(四)替换法

这是我们在检查硬件是否存在问题时最常用的方法。当怀疑是网线问题时,更换一根确定是好的网线试一试;当怀疑是接口模块有问题时,更换一个其他接口模块试一试。

五、故障处理对网络维护和管理人员的要求

首先网络管理人员对协议要求有精深的理解,然后能够引导客户详细描述出故障现象和相关信息,并且要充分了解自己所管理和维护的网络,要有对故障处理的文档记录和经验总结。



TAG:
评论加载中...
内容:
评论者: 验证码: