第3章 统计思想
任何一门学科,都有其定位的思想,其为学科之根,只有根深蒂固的思想,方能开出灿烂的学科之花。统计学也不例外,以下5点统计学思想可供参考。
3.1 抽样的思想
除非研究目的非常特殊,不然我们的研究对象不可能获取到总体,几乎都是总体中的样本,而样本都是从总体中按照随机化的原则抽取获得的。随机化抽样是指根据研究目的确定的研究总体中任何一个研究对象都要有同等的机会被抽到作为样本进行研究,从而推断总体情况。
抽样思想的精髓为化繁为简,化无限为有限,化不可能为可能。通过抽样我们可以获取研究样本,对有限的研究样本进行研究,从而得到样本统计量,进而推断总体情况。
3.2 总体推断思想
样本统计量是实际可以检测获得的,可是我们却志存高远,目的是研究总体。因为抽样误差的必然存在,所以样本统计量不等于总体参数,但会与总体参数比较接近。我们在一定误差的控制下,可以通过样本统计量去预测总体参数,具体包括两种方法:点值估计法和区间范围估计法,见图3-1。
图3-1 参数估计模式
点值估计认为样本统计量就等于总体参数,忽略了抽样误差,因此该法风险偏大,基本不用;参数估计法是指通过样本统计量,去预测一个总体参数的95%(或90%、99%,根据研究目的确定,95%最为常用)可信区间。
抽样思想与总体推断思想相互结合应用。只抽样,不推断,丧失了抽样的初衷。不抽样,又失去了推断的基础。
3.3 反证法思想
反证法的思想就是将我们要研究的问题凝练为两种可能A和B,然后证明其中的A不可能发生,那真理就是B。如一个警察追逐一个小偷至一个Y形路口,小偷不是往左上跑就是往右上跑,如果我们能够证明小偷往左上跑的概率P<0.05,那么请问警察应该往哪边追呢?按照小概率事件在一次事件过程中不可能发生的规则,警察应该往右上去追。
我们科研过程中,验证某药是否有疗效,我们将研究结局分为两种可能,H0:药物无效;H1:药物有效。然后采用对应的统计分析方法,去获取H0(药物无效)发生的概率,如果P<0.05,则H0(药物无效)不可能发生,则H1(药物有效)成立。若P>0.05,则H0(药物无效)是可能发生的,则我们不能够拒绝H0,因此尚不能认为该药无效。
3.4 小概率思想
在第1章中,我们已经学过小概率事件,即发生概率P≤0.05或P≤0.01的事件。小概率事件的应用意义就是小概率事件在一次抽样过程中发生的概率为0。因此,一旦我们判断出某事件的发生概率P≤0.05,我们判断该事件在个体水平不会发生。
小概率思想是统计推断的核心,是统计学价值的基础。假设检验就是反证法与小概率事件思想相结合的具体体现。图3-2中,他爱那个她吗?他爱你还是不爱你,用反证法去试试吧!
图3-2 小概率漫画
3.5 误差控制思想
尽管可以采用小概率事件原理进行统计推论以保证推论的准确性,然而,如果整个实验或试验或调查没有进行很好的质量控制,也是白搭,因此,实验设计必须有着误差控制的思想。误差控制可以具体体现在“三要素”和“四原则”上。同时假设检验也会发生统计学I类和II类错误,统计分析时均需加以考虑,方能在最大程度上推测总体的真实面目。统计学误差包括系统误差、抽样误差、随机测量误差和过失误差,相关章节已述,此处不赘。