更新时间:2021-03-19 19:26:40
封面
版权信息
编委
引言
第一部分 大数据简介
第1章 大数据概述
1.1 大数据的概念
1.2 大数据的特征
1.3 大数据的产生
1.4 大数据应用案例
第2章 大数据相关技术
2.1 数据采集和准备
2.2 分布式数据库
2.3 分布式数据分析框架
2.4 大数据分析与R
2.5 国泰安的大数据
第二部分 R语言
第3章 R语言简介
3.1 R语言概述
3.2 R的下载、安装和使用
3.3 R的包
第4章 R语言基本操作
4.1 数据结构
4.2 数据的基本操作
4.3 数据的管理
4.4 常用函数
第5章 R语言绘图
5.1 绘图参数
5.2 高级绘图函数
5.3 低级绘图函数
第6章 R语言数据分析
6.1 数据处理基础函数
6.2 描述性统计分析
6.3 多元统计分析
第三部分 专题实证研究
第7章 金融时间序列建模专题
7.1 金融时间序列
7.2 ARMA模型
7.3 GARCH模型
第8章 动态面板数据专题
8.1 GMM估计
8.2 动态面板数据模型的系统GMM估计
第9章 数据挖掘专题
9.1 关联规则
9.2 降维分析
9.3 社交网络分析
9.4 贝叶斯分类法
9.5 决策树
9.6 人工神经网络
9.7 支持向量机
第10章 信息可视化专题
10.1 绘制地图
10.2 可视化实例
第四部分 RHadoop案例分析
第11章 RHadoop的基本操作
11.1 数据文件的读取
11.2 包的加载
11.3 基本函数
第12章 RHadoop环境下案例分析
12.1 回归分析
12.2 Logistic分析
12.3 判别分析
12.4 聚类分析
12.5 主成分分析
12.6 因子分析
12.7 商品推荐算法
12.8 差异分析
附录一 国泰安CSMAR数据下载
附录二 深圳国泰安教育技术股份有限公司简介
参考文献