前言
1969年,互联网诞生之初,便随之诞生了“网工”这一特定群体。与“码农”不同,网工不仅要熟悉传输控制协议和互联网协议(Transmission Control Protocol Internet Protocol, TCP/IP)、链路层发现协议(Link Layer Discovery Protocol,LLDP)、多协议标签交换(Multi-Protocol Label Switching,MPLS)等五花八门的协议原理、报文封装,还要扛起整个基础网络设备从上架上电、设备配置,到实时监控、业务配置、割接优化等一系列工作。网工们白天盯告警、写配置,晚上守着电话值班,7×24小时不敢懈怠,相当辛苦。
现在的互联网,与其诞生之初已经天差地别,面貌完全不同,社交、短视频、电商等各种让人眼花缭乱的应用,都在朝着“All In Cloud”的趋势演进,而承载这些应用的云都是部署在网络之上的。哪个网站出现“404”页面无法访问了,哪家的支付突然无法使用了,哪个直播平台突然黑屏了,用户们首先想到就是“网络出故障了!”这时候,在各类负责运维的人员中,不论是应用运营人员、数据库管理员(Database Administrator, DBA)、云平台运营人员,第一批负责处理故障的人一定是网工。网工们一边查看各类告警,一边心中默念:千万别是网络原因,千万别是网络原因……一旦确认是网络问题,网工们就赶紧启动各类预案,一边掐着秒表一边看着流量图,想尽各种办法解决问题。
如今,网络10秒不可用的背后,往往意味着上百万、上千万的页面浏览量(Page Views, PV)的损失和不可估算的经济损失。一个错误命令的下发,不再只是被领导或者师傅批评几句这么简单的事了,给用户道歉、赔偿,被处分,甚至丢掉工作,都是有可能发生的事情。随着网络规模越来越大,部署其上的业务越来越多,用户和客户的要求越来越高,网工肩负的责任越来越重。即便是网络技术“大牛”,管理网络的时候敲个<Enter>键也越来越谨慎,生怕误操作导致发生不可挽回的损失。
于是乎,有了专门的网络管理平台。网工们过了一把甲方的瘾,把自己对网络管理的要求布置给开发,建起覆盖不同层级网络的网管平台,每年列出一个很长的需求清单,以三个月或半年为周期地进行平台的迭代更新……
于是乎,那些学过C++的网工们,为了速度更快一点,开始尝试着自己编写一些小脚本,把一些重复性的工作用脚本来实现,例如用脚本来定期从设备采集特定信息,例如用开源软件展示流量图……
于是乎,大家开始抱怨不管是值守还是紧急处理故障,计算机上都要打开太多窗口;大家开始抱怨平台、系统、工具越来越多,好用能用的却没有几个……
作为已经在网络运营战场上摸爬滚打二十载的“过来人”,笔者布过线缆,调过配置,做过规划,熬夜做过割接、做过保障,可以说对网工所涉及的相关工作都有过接触或者深切体会。最近几年,笔者虽然主要从事基础网络方面的工作,但在公司各种软件架构、软件开发技术、中间件、中台等知识的浸淫之下,已经习惯和适应了在网工、产品经理、系统架构师间做各种身份的切换与变化。
无论是自动化、智能化、DevOps,还是中台,不管是什么概念、什么技术,引入到网络这个领域中,最初目的都是让网工们更高效、更轻松地完成工作。软件技术发展到今天,我们完全有能力把中台、DevOps、自动化、智能化、大数据等最新理念和技术都融入进来,打造一个综合、统一、全面的网络运营平台。
本书就是构建一个企业网络运营平台全过程的经验总结。首先,这个平台是一个经验沉淀平台,能把网工多年的运营经验沉淀下来,所以它是匹配DevOps的;这个平台能够减少网工们的日常工作量,降低出错的概率,所以它是支持自动化的;这个平台是能够扩展和演进的,所以它是以中台的形态存在的;作为一个基础性质的运营平台,它是安全和可靠的。
本书主要内容如下。
第1章 从认识网络DevOps开始,介绍其概念、目标、理念以及构成,明确对其价值的认识,为后续的内容奠定基础。
第2章 介绍网络DevOps的核心——网络DevOps平台的定义、特点和作用,回顾网络DevOps平台的历史形态,对网络DevOps平台的架构进行初步介绍。
第3章 介绍网络DevOps平台架构设计的方法论,包括企业架构(TOGAF)、中台和DDD领域驱动设计三方面内容。
第4章 从网络运营的战略开始,分析业务、业务战略和业务价值链,并完成业务域拆分;以网络运营的两个子领域为例进一步设计应用架构,最后通过软件复杂度分析,完成网络DevOps平台的技术架构设计。
第5章 在企业架构设计的基础上,进行中台能力识别的实践。将企业架构与中台进行对应,对网络DevOps的业务中台、数据中台和技术中台进行说明。
第6章 逐一分析和阐述包括从机制到人员在内的网络DevOps运营模式落地的七个关键要素。
第7章 针对具备不同管控能力或者处于不同企业背景的网络团队,给出规划或者启动网络DevOps平台建设的一些建议。
第8章 从网络技术的自身发展、管控平台的范围拓展,以及管控智能化三个方面,展望网络DevOps平台的迭代演进趋势,并介绍基于意图的网络(Intent-Based Networking, IBN)。
本书内容的一大特点就是由故事情节推动,书中引入了五个角色:小P、老E、张sir、老A、老M,他们与其他小伙伴一起,承担了网络DevOps平台建设的主要工作。其中网工小P是主角,构建这个平台的过程就是他践行DevOps、从网工成长为具备产品经理的视角和能力、掌握业务架构和技术架构设计能力的系统架构师之路。小P和他的伙伴们代表着广大从事网络运营工作的同行们,小P们的实践、他们踩过的坑,或许就是广大读者朋友们在实际工作中遇到的问题、面临的困惑,读者朋友们一定能够从中体验到代入感和亲切感。
本书是行业内跨公司合作的结晶,由阎璐(丙姐)、冀晖(南迦巴瓦)共同编写。特别感谢机械工业出版社王斌编辑在本书出版过程中的细心审核,并就本书以网工成长故事为主线的内容组织形式提出了宝贵的建议;感谢中国电信研究院雷波老师的推荐,促成了本书的出版。感谢上海理工大学的叶佳妮同学为本书绘制了生动的插图。本书的编写也得到了多位行业专家的大力支持和诚挚建议,在此对他们表达真诚的谢意!
由于自身水平有限,技术的发展又日新月异,书中难免出现一些遗漏和错误,欢迎广大读者朋友们指正,并通过邮件方式与我们沟通交流(devops888@163.com),在此表示感谢!
作者
2022年8月