更新时间:2019-12-05 11:51:08
封面
版权信息
内容提要
大数据专业系列图书编写委员会
序
前言
第1章 Hadoop介绍
1.1 Hadoop概述
1.2 Hadoop核心
1.3 Hadoop生态系统
1.4 Hadoop应用场景
小结
第2章 Hadoop集群的搭建及配置
任务2.1 安装及配置虚拟机
任务2.2 安装Java
任务2.3 搭建Hadoop完全分布式集群
实训
课后练习
第3章 Hadoop基础操作
任务3.1 查看Hadoop集群的基本信息
任务3.2 上传文件到HDFS目录
任务3.3 运行首个MapReduce任务
任务3.4 管理多个MapReduce任务
第4章 MapReduce编程入门
任务4.1 使用Eclipse创建MapReduce工程
任务4.2 通过源码初识MapReduce编程
任务4.3 编程实现按日期统计访问次数
任务4.4 编程实现按访问次数排序
第5章 MapReduce进阶编程
任务5.1 筛选日志文件并生成序列化文件
任务5.2 Hadoop Java API读取序列化日志文件
任务5.3 优化日志文件统计程序
任务5.4 Eclipse提交日志文件统计程序
第6章 项目案例:电影网站用户性别预测
任务6.1 认识KNN算法
任务6.2 数据预处理
任务6.3 实现用户性别分类
任务6.4 评价分类结果的准确性
参考文献