监控平台解密:IT系统风险感知和洞察
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.3 监控系统的分类

Gartner在AIOps Will Provide Consolidated Analysis of Monitoring Data(AIOps将提供监控数据的综合分析)中将监控分为:ITIM、NPMD、APM、DEM四类,各类监控软件及数据汇聚在一起构成了IT运维的人工智能(Artificial Interlligence For IT Operations,AIOps)监控,如图1-6所示。

图1-6 IT运维的人工智能监控

1.ITIM(IT Infrastructure Monitoring,IT基础设施监控)

IT基础设施监控主要针对操作系统、数据库、中间件、服务器、存储等。当然,日常我们也使用ITIM监控软件做一些简单的业务级别的监控,如进程的状态、性能等。

现在市面上常见的ITIM软件有:Zabbix、Open-falcon、Prometheus、Sensu,商用的有IBM Tivoli系列中的ITM/ITCAM、BMC的Potorl、HP的Openview Perfview/MeasureWare等。

2.NPMD(Network Performance Monitoring and Diagnostics,网络性能容量监控与诊断)

网络性能容量监控与诊断常对应网络基础监控和网络性能容量监控(Network Performance Monitoring,NPM)两大类。

网络基础监控一般通过SNMP、Syslog等协议,主动或被动向网络设备获取相关数据,完成网络设备的性能容量管理、网络拓扑管理、事件管理、设备管理、配置管理等工作。常见的有:Solarwinds网络管理系列产品、北塔软件网络监控系列产品等。

网络性能容量监控一般基于网络数据镜像技术,以NetScout为例,其主要致力于三类问题:①业务应用的网络流量是多少,是否有突发流量和网络拥塞;②业务应用为什么慢;③业务应用请求为什么提交不成功。

3.APM(Application Performance Monitoring,应用性能容量监控)

应用性能容量监控主要是针对业务系统的监控。需要明确的是,许多IT基础设施监控软件也提供了针对业务功能模块的监控,如IBM Tivoli Composite Application Management有针对WAS、SOA、Dadabase等业务组件的监控模块,且产品也被定义为“Application”监控,但一般不把它们当作APM软件,而是当作ITIM。

国外的APM有Dynatrace、pinpoint、Traceview等,国产的APM软件也有听云(Tingyun)、天旦(Netis)、科来等。

4.DEM(Digital Experience Monitoring,数字体验监控)

DEM软件用于发现、跟踪和优化网络资源和最终用户体验。这些工具可以监视流量、用户行为和许多其他因素,以帮助企业了解其产品的性能和可用性。DEM产品集成了主动或模拟的交通监测和真实用户监测,分析了理论性能和真实用户体验。这些为检查和改进应用程序和现场性能提供了分析工具,还帮助企业了解访问者如何浏览他们的网站,并发现终端用户的体验是否受到了影响。

DEM和APM的界限稍有模糊,如Dynatrace也常被认为是DEM监控软件。另外,DEM还有Centreon、Nexthink、Catchpoing等。