上QQ阅读APP看书,第一时间看更新
序
流处理(Stream Processing)这个概念很早就被提出,但受限于算力和应用场景等诸多因素,直到最近几年才逐渐被业界重视。大数据领域先后出现了Hadoop、Spark、Flink等开源大数据框架,其中Flink因其在流处理上高吞吐、低延迟的优势,逐渐得到了工业界的青睐。随着流处理技术的成熟以及各类业务对实时性的要求越来越高,更多的数据处理应用将从批处理逐渐迁移到流处理。
本书作者是中国人民大学校级计算平台的技术人员,具有多年建设和维护大数据应用系统的经验,日常需要支持师生课程学习和科研工作,回答师生的各种问题,经过近一年的努力,撰写了《Flink原理与实践》一书。本书有以下三个特点。
第一,本书对初学者很友好。本书以初学者角度讲解和分析流处理,从Flink历史背景到编程入门,从原理机制到源码案例,从应用实战到系统部署等进行了深入浅出的介绍。初学者通过本书的学习,不仅可以了解流处理的基本原理和运行机制,而且能为职业发展奠定基础。
第二,本书内容贴近工业实践。本书从具体的应用场景入手介绍Flink,可读性较好。本书通过对一些工业界的具体案例的业务逻辑、技术架构和数据流上下游的介绍,可以帮助读者更好地理解流处理。
第三,本书提供大量代码实例和原理解析。相比于很多书籍单纯翻译国外文献和文档,本书不仅提供了编程上手指南,还使用具体的案例和代码来解释各类Flink API的使用方法。在一些重要的地方,作者还从源代码层面进行了剖析,帮助读者知其然也知其所以然。
本书对于高校本科生或研究生、大数据应用的开发者都是一本不错的入门书和参考书。特此推荐。
杜小勇
中国人民大学教授
2020年12月