更新时间:2021-09-26 16:18:15
封面
版权信息
第3版前言
第2版前言
致谢
关于作者
第1章 引论
1.1 个人计算机与统计学
1.2 统计学和数据分析
1.3 EDA简介
1.4 EDA范式
1.5 EDA的弱点
1.6 小数据和大数据
1.6.1 数据规模特征
1.6.2 数据规模:个人观点
1.7 数据挖掘范式
1.8 统计学和机器学习
1.9 统计数据挖掘
参考资料
第2章 数据处理相关学科:统计学和数据科学
2.1 引言
2.2 背景
2.3 统计学与数据科学的比较
2.4 讨论:统计学与数据科学的不同之处
2.5 本章小结
2.6 结语
第3章 变量评估的两种基本数据挖掘方法
3.1 引言
3.2 相关系数
3.3 散点图
3.4 数据挖掘
3.4.1 示例3.1
3.4.2 示例3.2
3.5 平滑散点图
3.6 一般关联性检验
3.7 本章小结
第4章 用于评估成对变量的基于CHAID的数据挖掘方法
4.1 引言
4.2 散点图
4.3 平滑散点图
4.4 CHAID入门
4.5 用更平滑的散点图进行基于CHAID的数据挖掘
4.6 本章小结
第5章 校直数据的简单性和可取性对建模十分重要
5.1 引言
5.2 数据的直度和对称度
5.3 数据挖掘是高级概念
5.4 相关系数
5.5 (xx3,yy3)散点图
5.6 挖掘(xx3,yy3)关系
5.7 基于遗传算法的数据挖掘如何处理数据
5.8 校直多个变量
5.9 本章小结
第6章 排序数据对称化:提高数据预测能力的统计数据挖掘方法
6.1 引言
6.2 量度范围
6.3 茎叶图
6.4 箱线图
6.5 排序数据对称处理方法的图示
6.5.1 示例1
6.5.2 示例2
6.6 本章小结
第7章 主成分分析:多变量评估的统计数据挖掘方法
7.1 引言
7.2 EDA重新表述范式
7.3 关键点
7.4 PCA基础
7.5 示例详解
7.6 PCA的代数特征
7.7 一个不常见示例
7.7.1 R_CD元素(X1,X2,X3,X4,X5,X6)主成分分析
7.7.2 R_CD元素(X1,X2,X3,X4,X5,X6)主成分分析结果
7.8 用PCA构造准交互变量
7.9 本章小结
第8章 市场份额估算:一个特殊的数据挖掘案例
8.1 引言
8.2 背景
8.3 一个特殊的数据挖掘案例
8.4 构建RAL的YUM市场份额模型
8.4.1 市场份额模型的十分位分析
8.4.2 YUM_3mos市场份额模型的结论
8.5 本章小结
附录8.A 生成PROMO_Code哑变量
附录8.B PROMO_Code哑变量的PCA
附录8.C PROMO_Code哑变量上的逻辑斯谛回归YUM_3mos
附录8.D 生成YUM_3mos_wo_PROMO_CodeEff
附录8.E 将变量标准化为位于[0,1]内
第9章 相关系数在[-1 +1]内取值,是这样吗
9.1 引言
9.2 相关系数的基础知识
9.3 计算相关系数
9.4 重新配对
9.5 计算经调整的相关系数
9.6 重新配对的意义