上QQ阅读APP看书,第一时间看更新
课后习题
一、单选题
1.大数据分析针对的是什么样的数据集合?( )
A.单一的
B.海量的、多样化的
C.无须处理的
D.传统的
2.ETL是3个单词的缩写,分别代表什么意思?( )
A.抽取、分析、存储
B.清洗、转换、分析
C.抽取、转换、装载
D.分析、展示、装载
3.“提取隐含在数据中的、人们事先不知道的、但又是潜在有用的信息和知识。”这是在描述哪一项技术?( )
A.数据清洗
B.数据收集
C.数据展示
D.数据挖掘
4.目前大数据分析的比较主流编程语言是( )。
A.Python
B.Java
C.C语言
D.R语言
5.哪一个库是Python的数据分析库,是为解决数据分析任务而创建的?( )
A.numpy
B.pandas
C.sklearn
D.matplotlib
二、填空题
1.__________是有目的地进行收集、整理、加工和分析数据,提炼有价值信息的过程。
2.__________的目的在于提高数据质量,将脏数据“清洗”干净,使原数据具有完整性、唯一性、权威性、合法性、一致性等特点。
3.__________适合简单的统计分析,其内置的数据分析工具不仅方便好用,功能也基本齐全,可以完成专业数据分析工作。
4.__________是Python包管理工具,该工具提供了对Python包进行查找、下载、安装、卸载的功能。
5.__________是用来查看pip版本的命令。
三、简答题
1.什么是数据分析?
2.请列举几个大数据分析编程语言。
3.通常安装第三方库的方法有几种?请列举。