系统与服务监控技术实践
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

3.2 可靠性监视器

可靠性监视器,是Windows Server 2008操作系统内置的监视功能,通过该功能管理员可以了解服务器的系统运行状况。从Windows Server 2008操作系统安装成功时起,每过24个小时,系统就会对统计出来的数据内容进行统计,并自动生成一个系统稳定性系数,通常该系数数值位于0~10之间,数值越高说明系统的可靠性越高,该系数数值将自动显示在可靠性图表中。Windows Server 2008操作系统自动对Windows故障、硬件故障、应用程序故障、软件安装(卸载)以及其他故障进行可靠性统计。当可靠性监视器连续收集28天的数据后,可靠性监视器图表将显示一条使用黑色方块节点串连起来的实线,显示计算机在一段时间区域内的运行状况。

3.2.1 可靠性监视器概述

“可靠性监视器”窗口包含两个显示区域,上面区域是系统稳定性图表,下面区域为“系统稳定性报告”,显示系统自动统计的关联数据。

1. 系统稳定性图表

系统稳定性图表的上半部分显示稳定性系数图表。在该图表的下半部分,显示跟踪的可靠性事件,该事件将有助于系统的稳定性测量,或者提供有关软件安装和删除的相关信息。当检测到每种类型的一个或多个可靠性事件时,在该日期的列中会显示一个图标,如图3-24所示。图标代表以下意思:

图3-24 系统稳定性图表之一

● “”信息图标,图表中该图标所在的位置表示Windows Server 2008操作系统在那一刻有操作成功的提示信息存在。

● “”警告图标,图表中该图标所在的位置表示Windows Server 2008操作系统在那一刻有安全隐患操作存在。

● “”错误图标,图表中该图标所在的位置表示Windows Server 2008操作系统在那一刻有错误操作存在。

● “” 黑色方块图标,图表中该图标所在的位置表示Windows Server 2008操作系统每一天的事件采集点,每一个事件采集点包含5个方面的信息,分别是:Windows故障信息、硬件故障信息、应用程序故障信息、软件安装卸载信息和其他故障信息。

Windows Server 2008操作系统自动对每一个事件采集点收集来的5个方面的信息进行综合评估,并对系统的运行稳定性进行量化评估,其中最稳定的系统状态,其可靠性的评估分为10分。随着系统运行时间的推移,系统运行的可靠性将逐步下降。

默认情况下,可靠性监视器显示最近日期的数据。若要查看特定日期的数据,选择系统稳定性图表中的“日期”,或者单击日期下拉列表选择“选择日期”选项,在日期列表中选择目标日期,如图3-25所示。

图3-25 系统稳定性图表之二

若要查看所有可用的历史数据,单击日期下拉列表选择“全部”选项,即可显示所有日期可靠性监视结果。如果采集的数据超过30天,则使用系统稳定性图表底部的滚动栏,浏览可见范围以外的日期,如图3-26所示。

图3-26 系统稳定性图表之三

2. 系统稳定性报告

系统稳定性报告,能够帮助管理员通过识别产生的事件确定造成系统稳定性降低的原因。单击每个可靠性事件类别右侧的“+”图标,可以查看事件列表。如果选择系统稳定性图表中的日期列,则系统稳定性报告将显示该日期的事件。若要查看系统稳定性图表中的所有事件或选择可见范围以外的日期,选择日期下拉列表并使用日历,或选择“所有日期”,查看选择的时间区间产生的与可靠性相关的事件。系统稳定性报告包括以下5种类型的事件,分别是:软件安装(卸载)、应用程序故障、硬件故障、Windows故障以及其他故障。

(1)软件安装(卸载)

在此类别中跟踪软件安装和删除执行的结果,包括操作系统组件、Windows Update、驱动程序和应用程序。监视的数据信息如表3-2所示。

表3-2 软件安装参数

(2)应用程序故障

在此类别中跟踪应用程序故障,包括已经终止或已停止工作的应用程序。监视的数据信息如表3-3所示。

表3-3 应用程序故障参数

(3)硬件故障

在此类别中跟踪磁盘和内存故障。监视的数据信息如表3-4所示。

表3-4 硬件故障参数

(4)Windows故障

在此类别中跟踪操作系统和启动故障。监视的数据信息如表3-5所示。

表3-5 Windows故障参数

(5)其他故障

在此类别中跟踪影响稳定性且未归入上述类别的故障,包括操作系统意外关闭。监视的数据信息如表3-6所示。

表3-6 其他故障参数

(6)故障处理模式

可靠性监视器报告应用程序故障、Windows故障,或者软件安装或删除故障,可以跟踪中发生故障的应用程序或操作系统组件。使用“Windows Update ”以及“问题报告和解决方案”组件,从微软知识库中搜索可能解决问题更新或者补丁。如果存在故障的应用程序不是微软公司的产品,且“问题报告和解决方案”中没有解决方案,可以尝试搜索应用程序提供商的网站以获取软件更新。

3.2.2 启动可靠性监视器

管理员可以通过命令行模式或者图形界面模式启动可靠性监视器。

1. 命令行模式

第1步,选择“开始”→“运行”命令,显示“运行”对话框,在“打开”文本框中键入“perfmon”,单击“确定”按钮,如图3-27所示。

图3-27 命令行启动可靠性监视器之一

第2步,单击“确定”按钮,显示如图3-28所示的“可靠性和性能监视器”窗口,选择“可靠性和性能”→“监视工具”→“可靠性监视器”选项。

图3-28 命令行启动可靠性监视器之二

2. 图形模式

选择“开始”→“管理工具”→“服务器管理器”选项,打开“服务器管理器”窗口。选择“服务器管理器”→“诊断”→“可靠性和性能”→“监视工具”→“可靠性监视器”选项,显示如图3-29所示的窗口。

图3-29 图形模式启动可靠性监视器

3.2.3 监控系统数据

Windows Server 2008的可靠性监视器,自动监控Windows故障、硬件故障、应用程序故障、软件安装(卸载)以及其他故障类别的错误,当错误发生后,管理员通过可靠性图表即可发现并捕捉产生的错误,了解错误产生的原因。

1. 监控指定日期数据

在“可靠性监视器”窗口中选择某一天的可靠性系数后,在“系统可靠性报告”区域看到对应这一天的详细统计数据,如图3-30所示。管理员可以监控选择的计算机是否出现Windows故障、是否存在硬件故障、应用程序在使用过程中是否发生过意外、有没有进行过软件安装操作或者卸载操作等,依照统计结果,管理员可以在第一时间采取措施保护服务器操作系统安全。例如升级硬件驱动程序,及时更新Windows系统补丁程序,或者将存在稳定性隐患的软件及时从系统中卸载等。

图3-30 监控系统数据之一

2. 监控软件安装(卸载)

在“系统稳定性报告”区域,选择“查看软件安装(卸载)”选项,单击该选项右侧的“+”图标,显示指定日期发生的软件安装(卸载)行为,如图3-31所示。

图3-31 监控系统数据之二

3. 监控应用程序故障

在“系统稳定性报告”区域,选择“查看应用程序故障”选项,单击该选项右侧的“+”图标,显示指定日期应用程序出现的故障,如图3-32所示。

图3-32 监控系统数据之三

4. 监控硬件故障

在“系统稳定性报告”区域,选择“硬件故障”选项,单击该选项右侧的“+”图标,显示指定日期计算机硬件出现的故障,如图3-33所示。

图3-33 监控系统数据之四

5. 监控Windows故障

在“系统稳定性报告”区域,选择“Windows故障”选项,单击该选项右侧的“+”图标,显示指定日期Windows操作系统出现的故障,如图3-34所示。

图3-34 监控系统数据之五

6. 监控其他故障

在“系统稳定性报告”区域,选择“其他故障”选项,单击该选项右侧的“+”图标,显示指定日期系统中出现的其他故障,如图3-35所示。

图3-35 监控系统数据之六