Python广告数据挖掘与分析实战
上QQ阅读APP看书,第一时间看更新

2.2.5 泊松分布

泊松分布适用于事件在随机时间和空间上发生的情况,其中,我们只关注事件发生的次数。假设电影院里有一台爆米花机和一台饮料机,x代表爆米花机每周发生故障的次数,y代表饮料机每周发生故障的次数,则称x和y为泊松随机变量,x和y均服从泊松分布。

图2-2 标准正态分布

在现实生活中还有一些服从泊松分布的例子。例如医院在一天内接到的紧急电话的数量、某个地区在一天内报告失窃的数量、在一小时内抵达销售现场的客户人数、书中每一页打印错误的数量。

当以下假设成立时,则称数据服从泊松分布:

·任何两个事件发生与否互不影响,两者互相独立;

·每次事件发生的概率保持相等;

·当时间间隔变小时,在给定的间隔时间内成功的概率趋向于零。

泊松分布中常用到的符号如下所示:

·λ是事件发生的速率;

·t是时间间隔的长度;

·x是该时间间隔内的事件数。

μ表示长度为t的间隔中的平均事件数,即μ=λt。

泊松分布中x的均值和方差分别如下。

·均值:E(x)=μ

·方差:Var(x)=μ