拓展阅读
贝叶斯公式是概率论中最重要的知识点之一,该公式的意义在于开创了统计学的一个学派——贝叶斯学派,它和经典统计学学派为现代统计学的两大分支.贝叶斯公式是由英国学者贝叶斯(Thomas Bayes,1701年—1761年)为了解决二项分布的概率估计问题所提出的一种“逆概率”思想发展而来的.“求概率这个问题的逆概率”是指已知事件的概率为p,可计算某种结果出现的概率问题;反之,给定了观察结果,则可对概率p作出试验后的推断.即“正概率”是由原因推结果,“逆概率”是由结果推原因.贝叶斯的思想,以及其支持者对其思想的发展和在应用上的良好表现,最终发展成了贝叶斯统计理论,从而开辟了统计学发展中的一个新领域,对统计决策函数、统计推断、统计的估算等做出了贡献.贝叶斯学派与经典统计学的差别在于是否使用先验信息,先验信息是指人们对一个事物的历史认知或主观判断.众所周知,任何事物都是发展变化的,都会通过样本数据信息不断挖掘和发现新变化.经典统计学只使用样本数据信息,而贝叶斯分析则是把先验信息与样本数据结合起来进行推断.
我们来看下面的例子:
一袋中共装有10个球,分别为红球和白球,但是每种颜色的球有几个不是很明确,有下列三种可能:A1:可能是装有6个红球,4个白球;A2:也可能是装有7个红球,3个白球;A3:还可能是装有5个红球,5个白球.开始认为这三种可能性分别为
于是我们从这个袋中任取一球,得到了红球,此时我们应该怎么来修正自己的看法呢?
在这个问题中,就是先验信息,任取出一球是红色即是试验的样本数据信息,我们记为B,则
同理可得
所以,经过一次样本抽取的结果,结合先验信息,我们得到了关于A1、A2和A3的后验概率(也称为后验信息)依次为如果觉得这个结果不可靠,还可以再进行第二次的抽样.把刚刚得到的后验信息作为新一轮抽样前的先验信息,继续使用贝叶斯公式计算和调整,就可以得到第二次抽样后的后验概率,这个后验概率将会比第一次的后验概率更可靠.如此迭代反复,基于先验信息,随后通过诸多实践和抽样,对事物的认识会不断加深和调整,最后将对事物的认识达到一个新高度.