超大流量分布式系统架构解决方案:人人都是架构师2.0
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第2章 大促备战核弹——全链路压测

当业务越发复杂、系统规模越来越大,以及外围资源依赖得越来越多时,系统中可能存在的各种不确定性因素也会随之被放大,甚至一个细微的错误都有可能导致交易系统出现雪崩。因此压测成为开发人员在大促前夕检测系统短板、瓶颈最有效的手段,为相应的风险点制定出有效的预案,才能够避免大促时不被那些不确定性因素所带来的影响打个措手不及。

验证系统所能够承受的最大负载是否接近于预期,是否经得住大流量的冲击,绝非是一件易事。有过分布式系统开发经验的同学都应该非常清楚,简单对某个接口、子系统进行压测,并不能够准确探测出系统整体的容量水位,这是由分布式系统与生俱来的复杂性决定的,并且对环境、目标都有着极为严苛的要求。近些年,全链路压测似乎备受追捧,基本上各大互联网企业,比如:阿里、京东等都会在大促前夕利用自研的“军演系统”在线上进行压测实战演练,其目的就是确保大促来临时核心链路的整体稳定。本章笔者会重点为大家介绍,笔者所在企业是如何在大促前夕对线上环境实施全链路压测,以及如何做到有指导的在大促前进行容量规划和性能优化,让系统坚如磐石。