计算机网络技术实用宝典(第3版)
上QQ阅读APP看书,第一时间看更新

5.4 查找/检测故障的方法

下面介绍几种硬件故障的诊断方法,选择使用一种或联合使用几种有效的故障诊断方法可以让故障检测诊断工作更加轻松、准确。

5.4.1 原理分析法

原理分析法是从理论上进行分析,按照计算机的基本原理,根据计算机安排的时序关系,从逻辑上分析各部件应有的特征,进而找出故障原因。简单地讲,就是在一定的时刻,某个部件或者说一个点应该满足一定的特征,有一个正确的外在表现,如果不满足,那么就说明这个部件可能有故障,然后再进一步分析该部件,最终找到故障所在。这是排除计算机故障的基本方法,但也是最复杂和最困难的一个方法,一般在查找故障时是不用的。

5.4.2 观察法

观察,是维修判断过程中的第一要法,它贯穿于整个维修过程中。观察不仅要认真,而且要全面。要观察的内容包括:

1.周围的环境

电源环境,其他高功率电器,电、磁场状况,机器的布局,网络硬件环境,温湿度,环境的洁净程度及安放计算机的台面是否稳固,周边设备是否存在变形、变色、异味等异常现象,等等。

2.硬件环境(包括接插头、插座和插槽等)

机箱内的清洁度、温湿度;部件上的跳接线设置、颜色、形状、气味等;部件或设备间的连接是否正确,有无错误或错接、缺针、断针等现象;用户加装的与计算机相连的其他设备等一切可能与计算机运行有关的因素。

3.软件环境

系统中加载了何种软件,它们与其他软、硬件间是否有冲突或不匹配的地方;除标配软件及设置外,要观察设备、主板及系统等的驱动、补丁是否安装、是否合适;要处理的故障是否为业内公认的BUG或兼容问题;用户加装的其他应用与配置是否合适。

4.用户的操作习惯、过程

观察用户的操作过程和习惯是否符合要求等。

另外在加电过程中需观察:元器件的温度、有无异味、是否冒烟等;系统时间是否正确;在拆装部件时需有记录部件原始安装状态的好习惯,且要认真观察部件上元器件的形状、颜色、原始的安装状态等情况。

另外,还可以通过手摸、眼看、鼻闻、耳听等方法做辅助检查,一般组件发热的正常温度(指组件外壳的温度)不超过50℃,手指摸上去有一点温度,大的组件摸上去有点热,但不烫手。如果手指摸组件烫手,则组件可能内部短路或散热不佳,应将该组件换下来或是更换散热装置。对电路板,有时要仔细看一下有没有断线、杂物和虚焊等。遇到焦色、龟裂、组件字迹颜色变黄等情况,应更换该组件。一般来说,计算机内部某芯片烧坏时会发出一种异味,此时应马上关机检查,不应再加电使用。耳听,一般要听有无异声,特别是驱动器更应仔细听。如果其与正常声音不同则应立即检修。例如,驱动器启动后,若有撞车声,说明没有寻到零道。

5.4.3 替换法

替换法是用好的部件去代替可能有故障的部件,借以判断故障现象是否消失的一种维修方法。好的部件可以是同型号的,也可以是不同型号的。替换的顺序一般为:

①根据故障的现象或故障类别,来考虑需要进行替换的部件或设备。

②按先简单后复杂的顺序进行替换。例如,先内存、CPU,后主板,又如要判断打印故障时,可先考虑打印驱动是否有问题,再考虑打印电缆是否有故障,最后考虑打印机或并口是否有故障等。

③首先查看怀疑有连接故障部件的连接线、信号线等,其次替换怀疑有故障的部件,再次替换供电部件,最后是与之相关的其他部件。

④从部件的故障率高低来考虑最先替换的部件,故障率高的部件先进行替换。

5.4.4 比较法

比较法与替换法类似,即用好的部件与怀疑有故障的部件从外观、配置、运行现象等方面进行比较,也可在两台计算机间进行比较,以判断故障计算机在环境设置、硬件配置方面的不同,从而找出故障部位。

5.4.5 最小系统法

最小系统法是指从维修判断的角度能使计算机开机或运行的最基本的硬件和软件环境。最小系统有以下两种形式。

1.硬件最小系统

由电源、主板和CPU组成。在这个系统中,没有任何信号线的连接,只有电源到主板的连接。检测时通过声音来判断这一核心组成部分是否可正常工作。

2.软件最小系统

由电源、主板、CPU、内存、显卡/显示器、键盘和硬盘组成。这个最小系统主要用来判断系统是否可完成正常的启动与运行。

对于软件最小环境,针对“软件”有以下几点要说明:

①硬盘中保留着原先的软件环境,只是在分析判断时,根据需要进行隔离,如卸载、屏蔽等。保留原有的软件环境,主要是用来分析、判断应用软件方面的问题。

②硬盘中只有一个基本的操作系统环境(可能是卸载掉所有应用程序,或是重新安装一个干净的操作系统),然后根据分析判断的需要,加载需要的应用。使用一个干净的操作系统环境,利于判断系统问题、软件冲突或软、硬件间的冲突问题。

③在软件最小系统下,可根据需要添加或更改适当的硬件。例如,在判断启动故障时,由于硬盘不能启动,先检查一下能否从其他驱动器启动。这时,可在软件最小系统下加入一个软驱或干脆用软驱替换硬盘来检查。又如,在判断音频、视频方面的故障时,需要在软件最小系统中加入声卡;在判断网络问题时,就应在软件最小系统中加入网卡等。

最小系统法的原理是先判断在最基本的软、硬件环境中,系统是否可正常工作。如果不能正常工作,即可判定最基本的软、硬件部件有故障,从而起到故障隔离的作用。

将最小系统法与逐步添加法结合,能较快速地定位发生的故障,提高维修效率。

5.4.6 拔插法

拔插法,即通过将插件或者芯片“拔出”或者“插入”来寻找故障原因的方法。此方法简单且有效,适合进行一般硬件检测时运用。比如,计算机在出现“死机”或者某个部件失效等很难确定原因的故障时,从理论上分析很难,但是采用拔插法,可以迅速地找到故障的原因。

拔插法的介绍:拔出插件,每拔一块,测试一次计算机状态。当拔下一块插件后计算机恢复正常,那么证明故障出现在刚才拔下的插件上,否则就继续依次拔下插件,直到查找到故障的原因。另外,有些芯片、插件和扩展槽之间可能接触不良,使用拔插法可以解决因为接触不良而使计算机不能正常运行的故障。拔插法不仅适用于计算机故障的排除,还可用于大规模集成电路芯片的检修。

5.4.7 诊断程序测试法

诊断程序测试法简称“诊断法”,一般采用一些专门检查机器故障的程序作为工具,进行计算机故障的检测,因为程序的作用是检测计算机故障,所以,诊断程序必须符合一定的要求。

能够严格地对计算机的各个部件进行检查,能考虑到各种情况的变化,并且能给出详细的诊断报告。在检查过程中,不仅能检查计算机各硬件的运行状况,也可以使用户对整个系统的可靠性、系统工作能力、部件之间的相互干扰有一定的了解。

发现故障时,能够尽量缩小和定位范围,这样便于用户找到故障原因,从而进行排除。

诊断测试法可分为:简易程序测试法、检查诊断测试法和高级诊断法。

①简易程序测试法:针对具体故障,通过编制简单而有效的检查程序辅助测试和检测计算机故障的方法。一般使用这种方法时,用户要具有一定的故障现象分析能力。

②检查诊断测试法:采用系统提供的专用检查诊断程序辅助查找故障,一般由系统提供的检查诊断程序具有多个测试功能模块,可以对处理器、存储器、显示器、硬盘及其他硬件设备进行检测,通过详细的检查报告或者错误提示信息,使用户准确掌握计算机故障的原因和发生位置,从而进行排除。

③高级诊断法:利用厂家提供的诊断程序诊断,这类程序针对某个具体部件进行检测,提供了详细的菜单和多种检测方式,可以详细地对系统的各部分进行检测,通过问题反馈流程编码让用户迅速地找到故障原因。诊断程序测试法把理论和实践相结合,依靠已有的诊断工具,为用户检查故障提供了极大的便利。

5.4.8 静态特征测量法和动态分析法

静态特征测量法是把计算机暂停在某一待定的状态上,根据逻辑原理,用电表测量参考点的电平,分析判断故障原因的一种方法。元器件的故障大部分能用“测量法”来检测,但有时也可能找不到故障原因。因为有的组合条件是一个脉冲或脉冲序列,无法用“测量法”来检测。很多故障在静态时不表现,因此必须使用下面介绍的动态分析法,来找出那些只有在连续工作情况下才出现的故障。

动态分析法就是设置某些条件或者编制一些程序,在计算机运行的状态下,用仪器观察有关组件的波形或记录脉冲个数,与正常情况相比较,来找出故障的原因。

上述两种方法主要针对计算机元器件故障的检测,比普通的故障检测要难,所以用户要根据自己对计算机的熟悉情况选用。

5.4.9 升温、降温法

有时候,计算机在工作时间较长或者环境温度变化时会出现一些故障,但是关机检查时却很正常,这时候需要用到升温、降温法。“升温法”就是人为地将环境温度升高,加速高温参数较差的元器件“发病”,从而找到故障的原因。“降温法”就是对可疑部件逐一降温。如果部件被降温后,故障消失了,则证明该部件热稳定性差,需更换。降温的方法有:

①一般选择环境温度较低的时段,如清早或较晚的时间。

②使计算机停机12小时以上。

③用电风扇对着故障机吹风,以加快降温速度。

实际上,升温、降温法采用了故障触发原理,也就是用形成故障的条件促使故障频繁发生,从而找出故障的根源。这种方法在确定了故障的大体范围后,使用起来简单、方便、易行。