Flink核心技术:源码剖析与特性开发
上QQ阅读APP看书,第一时间看更新

序一

2018年,在北京国家会议中心举办的Flink Forward峰会上,来自阿里巴巴、京东、字节跳动、美团等公司的大数据技术负责人向众多参会者介绍了如何使用Flink解决组织内部的业务问题,做到大规模实践。每个人都在热烈地讨论Flink相关的技术实践和应用场景,很难想象Flink是2014年才正式发布的大数据技术,但在场的所有人都深刻感受到实时计算浪潮的到来。现在看来,Flink的口号“实时即未来”(Real-time is the Future)正一步步地变成现实。

数据的快速产生与快速流动对实时分析提出了很高的要求。如果数据不能被很好地实时处理,那么数据本身所蕴含的实时价值会迅速消失。在Flink之前,流处理的解决方案不尽如人意,Storm、Spark Streaming都只能说是过渡方案。

在大家对流处理的需求日益迫切的同时,Google发表的关于MillWheel和Dataflow的两篇论文让我们依稀看到了下一代流处理技术的模样。恰逢其时,Flink作为新一代流处理计算引擎进入了人们的视野。它吸收了上一代流处理技术的经验,融合了学术界和工业界对下一代流处理技术的理论探索与实践,甫一问世,就迅速成为流处理技术的事实标准。

经过几年的飞速发展和社区的共同努力,Flink通过了众多严苛场景的检验,架构逐渐趋于稳定。本书的出版也可以说是恰逢其时,读者可以从中了解到Flink何以在流处理领域“独步天下”。本书从源码出发,对核心技术进行讲解,有助于读者更好地理解Flink,理解开源技术,实现从学习者、使用者到贡献者的身份转变。

范东来

华为云MVP,《Spark海量数据处理》作者