上QQ阅读APP看书,第一时间看更新
1.7 小结
本章介绍了Apache Kylin的背景历史和技术特点。尤其是它基于预计算的大数据查询原理,理论上它可以在任意大的数据规模上达到O(1)常数级别的查询速度,这是Apache Kylin与传统查询技术的关键区别,如图1-6所示。传统技术如大规模并行计算和列式存储的查询速度都在O(N)级别,与数据规模呈线性关系。如果数据规模扩大10倍,那么O(N)的查询速度就下降1/10,无法满足日益增长的数据分析需求。依靠Apache Kylin,我们不用再担心查询速度会随数据量的增加而降低,能更有信心面对未来的数据挑战。
图1-6 查询时间复杂度O(1)与O(N)对比