2.3.2 HDFS分布式文件系统的结构_大数据导论-QQ阅读男生历史网

大数据导论

上QQ阅读APP看书，第一时间看更新

上一章目录下一章

2.3.2　HDFS分布式文件系统的结构

HDFS采用master/slave架构。一个HDFS集群是由一个NameNode和一定数目的DataNodes组成。NameNode是一个中心服务器，负责管理文件系统的名字空间（namespace）以及客户端对文件的访问。集群中的DataNode一般是一个节点，负责管理它所在节点上的存储。HDFS暴露了文件系统的名字空间，用户能够以文件的形式在上面存储数据。从内部看，一个文件其实被分成一个或多个数据块，这些块存储在一组DataNode上。NameNode执行文件系统的名字空间操作，比如打开、关闭、重命名文件或目录。它也负责确定数据块到具体DataNode节点的映射。DataNode负责处理文件系统客户端的读/写请求。在NameNode的统一调度下进行数据块的创建、删除和复制，图2-4所示为HDFS文件统整体结构。

NameNode和DataNode被设计成可以在普通的商用机器上运行。这些机器一般运行着GNU/Linux操作系统（OS）。HDFS采用Java语言开发，因此任何支持Java的机器都可以部署NameNode或DataNode。由于采用了可移植性极强的Java语言，使得HDFS可以部署到多种类型的机器上。一个典型的部署场景是一台机器上只运行一个NameNode实例，而集群中的其他机器分别运行一个DataNode实例。这种架构并不排斥在一台机器上运行多个DataNode，只不过这样的情况比较少见。

图2-4　HDFS文件系统整体结构

集群中单一NameNode的结构大大简化了系统的架构。NameNode是所有HDFS元数据的仲裁者和管理者，这样，用户数据永远不会流过NameNode。

本周热推：

李攀龙诗选王维集欧阳修诗词文选评花千树：宋词是一朵情花（全新增订本）古典诗词诵读宝典：从历史走来的诗词曲谣联

上一章目录下一章