Doris实时数仓实战
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

Foreword 推荐序一

和春波老师的相识缘于共同服务的国内某一线零售企业的数据仓库建设项目。彼时春波老师作为项目架构师,大胆抛弃了传统Hive离线数据仓库的建设思路,直接从原有的数据仓库一体机一步进化至基于Apache Doris的MPP架构大数据平台,并推动了Apache Doris在该企业的大规模落地应用。而我作为Apache Doris社区维护团队的一员,在项目上线及运行过程中与春波老师有过多次交流和探讨,对春波老师在企业数字化转型之道上的思考印象深刻。

说来惭愧,时至2022年年末,已经进入Doris在OLAP领域深耕的十年之际,至今市面上很少有系统介绍Apache Doris的书籍,期间自己有多次念头想付诸笔墨,但一直因各种事务缠身未有机会落笔。春波老师的大作无疑是一场及时雨,拿到春波老师的书稿后,迫不及待地读完全文。书中内容翔实、案例贴切,由浅入深、娓娓道来,无不体现春波老师在行业大数据领域多年丰富的实践经验,对于想要学习Doris以及大数据和数据库知识的读者来说是一个非常棒的选择。

作为一款成熟的分析型数据库,Apache Doris有性能优异、简单易用、架构精简、稳定可靠、生态丰富等优势,不仅可以支持高并发的点查询场景,还能支持高吞吐的复杂分析场景。从最初的在线报表服务,到多维分析、即席查询,再到半结构化支持、联邦查询、数据湖加速,Apache Doris在实时报表、用户画像、用户行为分析、日志检索、统一查询网关、湖仓一体等诸多业务领域得到了很好的应用。

Apache Doris支持用户构建多种不同场景的数据分析服务,同时支持在线与离线的业务负载、高吞吐的交互式分析与高并发的点查询;通过一套架构实现湖仓一体、在数据湖和多种异构存储上提供无缝且极速的分析服务;通过对日志、文本等半结构化乃至非结构化的多模数据进行统一管理和分析,满足多样化数据分析需求。

正是由于以上优势,过去几年,Apache Doris获得了更多开发者和用户的认可:社区贡献者规模呈现急剧增长的态势,截至2022年年底已经突破400人,并且目前仍在持续增长中。这些贡献者分布在全球不同地域、不同行业的超百家企业中。

随着社区开发者和用户的共同努力,Apache Doris正朝着成为一款极速、易用、实时、统一的多模分析型数据库的目标大步前行。这也是我们希望Apache Doris能够带给用户的价值,不再让用户在多套系统之间权衡,仅通过一套系统即可解决绝大部分问题,降低复杂技术栈带来的开发、运维和使用成本,最大化提升生产力。

期待本书的出版能让更多人认识到Apache Doris,也期待未来有更多人可以参与到Apache Doris社区的建设中,帮助中国开源力量在全球舞台发光发热。

陈明雨

Apache Doris PMC Chair(项目管理委员会主席)