Hive大数据存储与处理
上QQ阅读APP看书,第一时间看更新

任务2.1 安装部署Hadoop集群

任务描述

通过Hadoop分布式框架可以轻松地将数千台服务器联合在一起对大数据进行存储和计算,而且每一台服务器都具有存储和计算的能力。用户可以在不了解Hadoop底层细节的情况下开发分布式程序,能够十分方便地利用集群的强大能力进行程序运算,而且能够解决高可用(分布式系统架构设计中的一个常见指标,意指通过设计减少系统不能提供服务的时间,从而保持其服务的高度可用性)问题。

本任务的内容包括虚拟机VMware Workstation(简称VMware)、Hadoop集群的部署过程,以及远程终端Xshell软件的安装和使用,为Hive的安装部署提供一个基础的集群环境。