Hive大数据存储与处理
上QQ阅读APP看书,第一时间看更新

课后习题

选择题

(1)Hive是建立在( )之上的数据仓库。

A.HDFS

B.MapReduce

C.Hadoop

D.HBase

(2)【多选】下列关于常见的大数据开发工具描述中,正确的是( )。

A.Excel具备多种强大功能,如创建表单、数据透视表、VBA等

B.SPSS是世界上最早采用图形菜单驱动界面的统计软件,其特点是操作界面极为友好,输出结果较为美观

C.Python是一种面向对象、解释型的程序设计语言,具备非常强大的数据分析能力

D.Hive的底层存储依赖于HDFS,因此Hive实质是一款基于HDFS的MapReduce计算框架

(3)【多选】Hive架构包含下列( )组件。

A.CLI和JDBC/ODBC

B.ThriftServer

C.Metastore

D.HWI和Driver

(4)【多选】Hive的特点包括( )。

A.HQL与SQL有着相似的语法,大大提高了开发效率

B.Hive支持运行在不同的框架上,包括YARN、Tez、Spark、Flink等

C.Hive支持HDFS与HBase上的即席分析

D.Hive不支持用户自定义的函数、脚本等

(5)【多选】下列关于Hive的适用场景的描述中,正确的有( )。

A.Hive适用于非结构化数据的离线分析统计场景

B.Hive的执行延迟比较低,因此适用于对实时性要求比较高的场景

C.Hive的优势在于处理大数据,因此适用于大数据(而非小数据)处理的场景

D.Hive的最佳适用场景是大数据集的批处理作业,如网络日志分析