大数据导论
上QQ阅读APP看书,第一时间看更新

第2章 大数据存储

本章介绍大数据存储相关技术的概念与原理,包括传统大数据存储系统的3种架构、分布式文件系统(HDFS)、NoSQL数据库、分布式数据库(HBase)以及NewSQL数据库技术。HDFS提供了能在廉价服务器集群中进行大规模分布式文件的存储能力;NoSQL数据库模型很好地支持Web 2.0应用,具有强大的横向扩展能力,有效补充了传统关系型数据库的不足,其中,HBase是一个高可靠、面向列、可伸缩的分布式数据库,主要用来存储非结构化和半结构化的松散数据,但NoSQL数据库也有缺点,如数据模型和查询语言没有数字验证,不支持ACID特性等,由此产生了在线事务处理(OLTP)的下一代可伸缩关系数据库管理系统NewSQL数据库。