Python广告数据挖掘与分析实战
上QQ阅读APP看书,第一时间看更新

2.6 本章小结

本章首先介绍了广告数据的特点及广告数据分析的意义,然后分别介绍了六种常见的数据分布,包括伯努利分布、均匀分布、二项分布、正态分布、泊松分布、指数分布以及它们各自的特点。本章还介绍了两种常用的异常值诊断方法,即三倍标准差法和箱形图分析法,通过异常值诊断方法可以快速发现数据中的异常值。考虑到在广告数据分析中经常要对变量的相关性进行分析,本章介绍了两种常用的二元变量相关系数:Pearson相关系数和Spearman秩相关系数。通过相关性分析可以快速找到变量之间的内在联系。最后还介绍了数据显著性检验的一般方法和步骤。总体来说,本章重点是向读者介绍广告数据的特点、分布以及数据分析中常用的观察指标,为后续学习其他章节做铺垫。