上QQ阅读APP看书,第一时间看更新
课后习题
选择题
(1)Hive是建立在( )之上的数据仓库。
A.HDFS
B.MapReduce
C.Hadoop
D.HBase
(2)【多选】下列关于常见的大数据开发工具描述中,正确的是( )。
A.Excel具备多种强大功能,如创建表单、数据透视表、VBA等
B.SPSS是世界上最早采用图形菜单驱动界面的统计软件,其特点是操作界面极为友好,输出结果较为美观
C.Python是一种面向对象、解释型的程序设计语言,具备非常强大的数据分析能力
D.Hive的底层存储依赖于HDFS,因此Hive实质是一款基于HDFS的MapReduce计算框架
(3)【多选】Hive架构包含下列( )组件。
A.CLI和JDBC/ODBC
B.ThriftServer
C.Metastore
D.HWI和Driver
(4)【多选】Hive的特点包括( )。
A.HQL与SQL有着相似的语法,大大提高了开发效率
B.Hive支持运行在不同的框架上,包括YARN、Tez、Spark、Flink等
C.Hive支持HDFS与HBase上的即席分析
D.Hive不支持用户自定义的函数、脚本等
(5)【多选】下列关于Hive的适用场景的描述中,正确的有( )。
A.Hive适用于非结构化数据的离线分析统计场景
B.Hive的执行延迟比较低,因此适用于对实时性要求比较高的场景
C.Hive的优势在于处理大数据,因此适用于大数据(而非小数据)处理的场景
D.Hive的最佳适用场景是大数据集的批处理作业,如网络日志分析