大数据项目管理:从规划到实现
上QQ阅读APP看书,第一时间看更新

阅读方式

本书的每一章都会涉及一个与数据项目管理相关的主题。你不必从头到尾阅读整本书,因为大多数章节的内容相对独立。不过,在启动数据项目之前,先阅读第1~3章将大有裨益。

以下是各章的主要内容。

第1章,数据项目的主要类型及考虑因素,概述3种主要的数据项目用例,并针对每个用例列举需要注意的一系列考虑因素。在启动新的数据项目之前,最好先阅读这一章。

第2章,评估和选择数据管理解决方案,为在分布式开源世界中选择技术解决方案提供指导。如果你正尝试启动数据项目,或者刚刚进入这个领域,这一章对于你来说也会非常有用。

第3章,数据项目的风险管理,讨论项目风险以及如何管理它们。风险管理是软件项目的一项重要活动,大型数据项目存在一些独特的风险,要成功实现这些项目,需要管理好它们。

第4章,接口设计,讨论系统接口的设计和实现。对于创建可维护和可扩展的系统来说,定义有效的抽象和合约至关重要。因此,我们在这一章会根据自己实现大型数据项目的经验提供一些指导。

第5章,分布式存储系统,讨论分布式存储系统。数据存储是所有数据系统的核心组件,这一章将列举一些常用的分布式存储系统。更重要的是,它还会提供一个用于评估存储系统的框架。

第6章,企业元数据,讨论元数据管理。这是在构建数据系统时的另一个至关重要但经常被忽视的方面。

第7章,确保数据完整性,讨论数据的完整性问题。这是在构建数据系统时的另一个需要注意的事项,需要在项目开始时进行规划。在构建支持多种存储格式的数据系统时,确保数据的完整性和传承关系变得更具挑战性。

第8章,数据处理,讨论可用于处理分布式数据的框架。在构建有价值的数据系统时,处理和分析数据的能力是另一个重要方面。与第5章类似,这一章也会提供一个框架,用于了解可用的数据处理系统以及评估哪些系统适合你的应用场景。