本章首先以数据生命周期为线索,提出了六层大数据技术体系,包括数据收集、数据存储、资源管理与服务协调、计算引擎、数据分析和数据可视化,接着介绍了大数据技术体系的两个经典视线:Google大数据技术栈和Hadoop与Spark生态系统,以及大数据架构,最后介绍了Hodoop与Spark的版本选择及安装部署。