监控平台解密:IT系统风险感知和洞察
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

推荐序三

运维监控,在很多人看来是一个传统的技术领域,在过去的二十多年里,BMC Patrol、HP OpenView、IBM Tivoli等外企传统监控产品一度成为国内监控领域的标配产品,但最近五年开源逐渐被认知、云计算成为数据中心建设核心、云原生开始崭露头角,新的运维监控技术和产品被大量采用,开源的Zabbix、Prometheus等监控系统逐渐成为主角。同时,人工智能技术的加持使得近几年智能运维AIOps成为大家关注的热点,通过人工智能技术提前发现问题、预防问题乃至自动解决问题,不正是运维团队一直期望和梦想的吗?所以,运维监控也是一个与时俱进的技术分支,其重要性随着企业数字化进程而相应提升。

中国外汇交易中心的核心交易系统是我国金融市场的重要金融基础设施,其本币、外币两大国内外交易系统及数十个周边交互系统共同承载覆盖国内外银行、证券、保险等行业3万多家机构投资者每天海量的本外币交易及相关业务。如何确保这么多系统及组件稳定运行,如何第一时间发现隐患,运维监控系统在其中扮演着最关键的角色。本人有幸曾和外汇交易中心的技术团队共同参与早期运维监控系统的规划和建设工作,外汇交易中心的技术团队经过多年实践,积累了大量宝贵经验,从IBM Tivoli到开源Zabbix监控,再到自研监控系统,所用监控工具及技术不断迭代,管理效能不断提升,确保了交易系统数十年如一日地可靠运行。

本书编著者姜才康负责的部门从开发中心到数据中心,经历了核心业务系统从开发阶段到生产运维阶段的全过程。哪里是可能的风险点、哪里是可能的性能瓶颈、哪里必须实现秒级监控、哪里需要进行历史数据汇总分析,他了然于心,他带队搭建的监控平台是业务系统长期稳定运行不可或缺的组成部分。

本书没有深奥的原理,也没有花哨的技术包装,实实在在从实战角度出发,从一个从业多年,同时具备开发和运维深厚经验的专家角度诠释了监控系统的建设之路,是一本在智能监控平台建设领域非常有参考价值的著作,相信读过此书的读者都会有自己的体会和收获。

沈鸥

北京青云科技股份有限公司副总裁