大数据分析处理(慕课版)
上QQ阅读APP看书,第一时间看更新

课后习题

一、单选题

1.大数据分析针对的是什么样的数据集合?( )

A.单一的

B.海量的、多样化的

C.无须处理的

D.传统的

2.ETL是3个单词的缩写,分别代表什么意思?( )

A.抽取、分析、存储

B.清洗、转换、分析

C.抽取、转换、装载

D.分析、展示、装载

3.“提取隐含在数据中的、人们事先不知道的、但又是潜在有用的信息和知识。”这是在描述哪一项技术?( )

A.数据清洗

B.数据收集

C.数据展示

D.数据挖掘

4.目前大数据分析的比较主流编程语言是( )。

A.Python

B.Java

C.C语言

D.R语言

5.哪一个库是Python的数据分析库,是为解决数据分析任务而创建的?( )

A.numpy

B.pandas

C.sklearn

D.matplotlib

二、填空题

1.__________是有目的地进行收集、整理、加工和分析数据,提炼有价值信息的过程。

2.__________的目的在于提高数据质量,将脏数据“清洗”干净,使原数据具有完整性、唯一性、权威性、合法性、一致性等特点。

3.__________适合简单的统计分析,其内置的数据分析工具不仅方便好用,功能也基本齐全,可以完成专业数据分析工作。

4.__________是Python包管理工具,该工具提供了对Python包进行查找、下载、安装、卸载的功能。

5.__________是用来查看pip版本的命令。

三、简答题

1.什么是数据分析?

2.请列举几个大数据分析编程语言。

3.通常安装第三方库的方法有几种?请列举。