更新时间:2022-08-16 16:32:46
封面
版权信息
作者简介
内容简介
前言
项目一 大数据采集认知
任务1.1 开始大数据采集认知
任务1.2 了解大数据采集平台
任务1.3 认识大数据预处理
任务1.4 了解大数据预处理常用工具
项目小结
习题
项目二 使用Apache Flume采集日志数据
任务2.1 Windows环境下的Apache Flume环境搭建
任务2.2 Apache Flume数据采集案例
项目三 使用Logstash采集日志数据
任务3.1 Logstash工具安装
任务3.2 Logstash数据采集工作
项目四 使用爬虫工具完成网页数据获取
任务4.1 使用Web Scraper完成列车时刻表数据采集工作
任务4.2 使用八爪鱼工具采集数据
项目五 完成招聘数据预处理
任务5.1 使用OpenRefine完成数据清洗任务
任务5.2 使用Kettle完成数据集成任务
项目六 数据可视化处理
任务6.1 数据可视化认知
任务6.2 熟悉Echarts数据可视化
任务6.3 使用Tableau Desktop完成数据可视化任务
项目七 数据标注
预备知识
任务7.1 安装Labelme图像标注工具
任务7.2 使用Labelme标注工具完成数据标注任务