精华区 [关闭][返回]

当前位置:网易精华区>>讨论区精华>>电脑技术>>● 认证工程师>>五花八门>>强化你的网络障碍排除技巧

主题:强化你的网络障碍排除技巧
发信人: chenjz(水中牛)
整理人: reynolds(2002-07-17 10:12:26), 站内信件
                强化你的网络障碍排除技巧 
Cindy Souders, MCSE, Techrepublic 
14/12/2001 

我个人喜欢把网络障碍排除过程想象成一个漏斗。在漏斗的顶端,亦即最宽阔的部分,代表了问题的症状以及各式各样的潜在原因与相关问题。位于底端则是专为排除这个特定问题的解决方案。障碍排除(troubleshooting)基本上是一种过滤信息并且将症状与解决方式互相比对的过程。在这篇文章里面,我们提供一些技巧,帮助你花最少的力气早日抵达漏斗的底端。 

放开心胸 
我们每一个人都各自有一块自己觉得工作起来最轻松的网络相关领域。如果我们对硬设备有偏好,那么我们可能花费太多时间在缆线以及交换器(switch)等硬设备上面,但是事实上却是使用者权限设定出了问题。如果我们对软件系统喜好成瘾,那么说不定会在计算机前面东按西指,输入一大堆指令整整两个小时以后才赫然发现问题出在一个松脱的缆线上面。虽然实际做起来并不容易,你还是应该试着对眼前的问题进行一次综观全局的评估,以确保你没有遗漏某些问题。 


将目标放在问题发生的时间点 
别忘记在大多数状况下,系统在不久之前都还是运作顺畅的。准确地确认问题产生前的时间或者当时发生的事件,能够让你排除与此问题无关的症状。重新将焦点放在正确症状上是非常重要的。 

用白板 
一块够大的白板对于障碍排除工作非常有用。你可以先把问题以及症状写在白板上,以此作为起点,随着你一步步缩小你的焦点范围,你可以将多余的信息擦掉或者划上叉叉记号,让眼前只留下必要及有用的信息。白板同时也能够帮助你将手边的问题以图解的方式向你的伙伴们说明。 

在不久之前,有一次我正在白板上写下我们的系统无法 ping 到公司网络外部的机器的问题。在看完我写下的批注之后,一位同事便告诉我我们的总办公室其中一部 DNS 服务器有时候会断断续续出现问题。在白板上解决问题让同事间变得容易沟通,并且确保所有人都能够了解问题所在。在这个例子里面,一旦问题被正确地定义出来,整个障碍排除的工作也就随之划下句点。 

永远优先检查硬设备 
在开始研究一项问题的时候,第一个步骤便是对症状进行仔细观察,以决定这个问题主要是发生在硬件或者软件上面。我们经常由于下面这些原因而忽略了优先检查硬设备这项基本原则: 

那看起来似乎太容易了。 
硬设备经常隐藏在我们不想去碰的地方。 
坐在计算机前面动动鼠标或者敲敲键盘输入指令,这要比卷起衣袖蹲在地上或者爬到高处与机器设备搏斗来的轻松容易多了。 
硬设备问题可能牵扯到较高的花费并且需要更多时间才能解决,因此你可能会将它视为一项最后手段来看待。 
虽然如此,既然硬设备是最容易排除的问题来源并且应该优先进行检查,网络障碍排除工作应该从下面这些步骤开始: 

检查缆线以及它们与各硬设备的连接点。 
执行硬件诊断测试,看看是否能够找出任何硬件损坏之处。 
在可能的状况下,试着重新激活服务器、路由器或者硬设备。从键盘死锁一直到网络路由异常,这项做法能够解决无数的问题。 
试着在另一部机器或者一个测试网络上面重现这个问题。 


软件障碍排除 

如果所有的硬设备看起来都正常,那么便到了该研究软件问题的时候了。当我们讨论到网络系统的时候,软件方面的问题通常可以将范围缩小到三种类型。以下让我们一一进行探讨。 

计算机本身的问题 
如果某个网络应用程序死锁不动或者无法正常运作,那么你必须确认问题究竟是由哪些工作所引发的。如果你最近才将这项应用程序进行版本升级(或者将它安装到升级过后的操作系统上),那么你可能必须浏览应用程序厂商网站,去找找该厂商是否有提供修补程序。 

如果一位使用者在浏览器,应用程序或者网络联机方面遇到问题,你可以尝试在另一位使用者或者计算机上面重现这个问题,这可以帮助缩小问题范围。这项做法对于桌上型计算机或者服务器的网络问题排除都同样有效。 

你也必须格外注意系统设定错误所造成的问题。举例来说,Windows 2000 内建一套非常强大的本地端安全原则与群组原则机制,如果一位初学者弄不清楚而设定错误,这项功能反而会变成 IT 技术支持人员的梦魇。此外确认问题是出在使用者或者计算机身上也是非常重要的一点。 

如果系统中存在一个 Windows NT4 或者 Windows 2000 网域,那么在排除使用者登入问题的时候,检查域控制器(domain controller)的登入问题便是一个关键性步骤。Windows 事件检视器(Windows Event Viewer)是一项用来找出错误讯息真正涵义非常好用的工具。如果你取得了一个事件识别码(Event ID number),那么你可以浏览微软公司的知识库(Microsoft Knowledge Base),将事件识别码输入到搜寻引擎里面便可找到与该问题相关的症状,原因以及解决方式。这是一项非常杰出的问题解决工具,能够让网络管理人员大幅提升工作效率。我个人每个月至少使用一次微软知识库。如果你是在其它操作系统上面工作,那么你应该手动或者使用该平台适用的纪录档案检视程序来检查系统纪录档案。 

局域网络问题 
如果网络联机出现问题,那么在 Windows 操作系统计算机上面你首先应该尝试的步骤是执行 IPConfig/all 指令(如果在 Linux 平台上面则应该使用 IFConfig 指令)。如果你的机器的 IP 地址、子网掩码以及网络网关等设定都是正确的,那么接下来就使用 ping 指令。首先 ping localhost 或者 127.0.0.1(在命令提示下输入指令)。接下来 ping 出现问题那部计算机的 IP 地址,以确认你的网络卡能够正常运作。 

如果这些 ping 指令执行的结果全都无法联机成功,那么在确定你的 TCP/IP 设定能够配合你的网络卡,以及你的网络卡确实能够正常运作之前,你不需要继续进一步尝试使用 ping 指令。 

但是如果这两次 ping 指令能够正常取得网络联机,那么你应该继续 ping 你的预设网络网关(default gateway)并且确定能够正常联机。如果联机正常,那么继续 ping 网络网关以外的计算机(某部位于你的广域网络或者网际网络上面的计算机)。如果这也没问题,那么继续仔细检查网络联机,尝试 ping 某部网际网络服务器的完整网域名称(Fully Qualified Domain Name, FQDN),例如 yahoo.com,以确认 DNS 服务器能够正常运作。 

如果以上所有 ping 指令执行结果都能够正常联机,但是计算机却还是无法正常连上网际网络或者你的广域网络,这时候便应该检查软件设定了。 

广域网络问题 
有时候你会遇到无法在本地端进行掌控的问题,例如网络专线以及广域网络联机异常,或者其它地方的办公室由于当地的路由器故障而无法连上网络。如果你无法找出任何硬件或者软件设定上的错误,而且你认为问题可能出在广域网络上面,那么你可能必须拨电话给你的电信服务公司(如果是网际网络联机问题)或者远程办公室所在的相对应单位(如果问题出在远程办公室的广域网络联机上)。 

最后结论 
以下再提供一些建议: 

将问题的规模与范围缩小到易于处理的程度。 
和部门同事分享你的点子与思考流程。 
试着不要在员工或者客户面前进行障碍排除程序。在可能的状况下,建议你走进一间办公室,关上房门,打开电话录音机或者语音信箱。观众可能会打扰你的工作,在没有观众的状况下进行障碍排除能够让你更容易集中精神处理问题。 
请求协助!不论你使用网际网络或者打电话给其它技术人员,你都可能找到某位曾经遇过相同问题的人。这可能是个向他人请益的完美时机。 
偶而放下手边的问题并且试着厘清脑海中的所有信息。这能够帮助你重新审视一些基本问题,并且探究是否有其它你一开始遗漏了的解决方案。 




----
小牛已不是,老牛没够格,想来又想去,还是中牛好。
   

[关闭][返回]