Python广告数据挖掘与分析实战
上QQ阅读APP看书,第一时间看更新

2.2.4 正态分布

正态分布(Normal Distribution)又名高斯分布(Gaussian Distribution),是一种非常常见的连续概率分布。正态分布可以表示现实生活中的大部分情况,大量的随机变量被证明是服从正态分布的。

·正态分布的特征主要有以下几点:

·正态分布的平均值、中位数和众数一致;

·正态分布曲线是钟形的,且关于x=μ对称;

·曲线下的总面积为1;

·有一半的值在对称中心的左边,另一半在对称中心的右边。

正态分布与二项分布有着很大的不同,但如果试验次数接近于无穷大,则它们的形状会变得十分相似。

服从正态分布的随机变量x的概率密度函数为:

服从正态分布的随机变量x的均值和方差分别如下。

·均值:E(x)=μ

·方差:Var(x)=σ2

其中,μ和σ是参数,分别表示均值和标准偏差。

当μ=0,σ=1时,正态分布就称为标准正态分布,标准正态分布的概率密度函数为:

随机变量x~n(0,1)的曲线图如图2-2所示。