1.6 递降分布统治社会之谜
这种普遍性递降的统计分布是深入理解人类行为、社会及经济现象的关键。下面我将具体介绍一下这个重要的统计分布曲线。
在统计学中,以正态分布——“吊钟形”分布居多(图1-2)。其特点是,以平均值为中心,两侧(高于平均值和低于平均值)的曲线左右对称。
图1-2 正态分布(泊松分布)和U分布的比较。正态分布呈吊钟形,以平均值为中心,两侧(高于平均值和低于平均值)的曲线左右对称。U分布是逐渐下降的曲线分布。半对数线图则呈一条直线分布。
我们来举一个正态分布的实例。掷了几次骰子后,点数的平均值是多少?假设我们掷了5次骰子,点数依次为3→5→1→6→1,那么3+5+1+6+1=16,16÷5=3.2,平均值就是3.2。如果我们反复掷多组,每组还是掷5次,虽然得出的平均值各不相同,但结果均以3.5为中心(骰子点数的平均值是3.5)上下波动。这就是正态分布。掷5次骰子得到的平均值大多都接近3.5,很少会出现像1或6这样偏离3.5的数值。因为想让平均值为1,就必须每次都掷出点数1,而这是极其偶然的情况。
在统计学的相关书籍中,很多书的内容都是以正态分布为前提的。想必许多人都认为,世界上大部分现象都可以用正态分布表示,其余的情况都是例外——“正态”这个名称本身就包含了这层意思。
但是,在现实社会中,大数据的统计分布大多为递降的U分布。在这一分布中,当变量为0时频率最高,随着变量的增大,频率会逐渐降低。并且,正态分布与U分布的形状差别很大,前者呈吊钟形,后者呈递降曲线(章末注2)。
我们该如何理解这一现象?难道只是碰巧变成了一条递降曲线?我查阅了许多书籍和文献,都没有找到人类行为呈递降分布这一规律的原因。每次见到统计学和物理学界的学者,我都会问:“为什么统计学中用正态分布进行研究,而物理现象用递降分布研究呢?”明明是基本的问题,却几乎没有人能回答上来(唯一明确回答我的,是巴西统计物理学界的权威康斯坦丁诺·查理斯教授。他的回答令我深受启发,在此也向他表示感谢)。很长一段时间以来,我的眼前仿佛烟雾弥漫,一片模糊。但是最近我通过模拟和解析,终于找出了让人心悦诚服的答案,眼前也顿时云开雾散,一片清明。
“反复之力”,是一种我们平时没有感知到的力量。通过研究,我渐渐看到了这种力量是如何撼动整个社会的。