别拿相关当因果!因果关系简易入门
上QQ阅读APP看书,第一时间看更新

1.3 为什么需要原因

原因难以界定又不易寻找,那么它们对我们究竟有什么好处呢?我们又为什么需要它们呢?有三件很重要的事只有在清楚原因的情况下才能做到,或者做到最好,这三件事是:预测、解释和干预。

首先,假设我们想要预测谁会赢得美国总统大选。专家们找到了各种规律,比如共和党人必须赢得俄亥俄州的选票才能赢得大选;自富兰克林·罗斯福之后,没有任何一位总统能够在失业率超过7.2%23时获得连任;美国从来没有女性总统(至少在我写作本书时是这样的)。24然而这些只是规律而已。我们可以在历任总统身上找到很多这样的规律,但是我们无法从中得知他们为什么会赢得大选。人们是根据失业率投票的吗?还是说失业率只是间接反映了国家形势和经济状况,暗示人们在失业率高的时候要寻求变革?更糟糕的是,如果我们发现的这些规律只是巧合,那么它们最终都会被打破。而且,这些数据是从很小的数据集中得出的;美国历史上只有44位总统,其中连任的总统还不到一半。

这就是黑盒问题:我们把数据输入黑盒子,然后从中得出一些预测,但是黑盒子不会对这些预测做出任何解释,也不会告诉我们这些预测为什么值得信赖。如果我们不知道这些预测为何会成真(为什么赢得某个州的选票就能赢得大选),也就无法预料它们的失败。如果我们知道俄亥俄州能够“决定”一场大选的原因是这个州的人口特征十分具有代表性,而且这个州从来不专属于某一个政党,那么我们就能由此预测。如果由于移民人口导致俄亥俄州的人口组成发生了巨大变化,那么之前的预测——它对大选有决定性作用——也就不复存在了。如果这个州只是反映全国总体趋势的一个间接指标,那还可以通过全国民意调查来获得更直接、更准确的预测。一般来说,与相关性相比,原因能够为我们提供更为可靠的方法来预测事件的结果。

再举一个例子,比如说某种基因的变异导致了运动耐量的提高和免疫反应的增强。然后我们可能会发现,运动耐量的提高对人体免疫反应来说是个好指标。然而,运动耐量的高低变化只是一个非常粗略的估计,因为除了基因突变以外,还有很多其他因素(比如充血性心力衰竭)也会导致运动耐量的变化。因此,只根据运动耐量进行诊断可能会导致很多误诊,错误地夸大或低估病人的病情。更重要的是,一旦了解到基因变异会引起运动耐量和免疫反应的双重提高/增强,我们就能获得两种测算风险的方法,并且能够避免收集过多的测量数据。既然运动耐量只是反映了基因的变化,那么我们就没有必要对这两者都进行测试。但值得注意的是,如果基因测试极易出错的话,那么运动耐量的测试数据也许能为我们提供确凿的证据。还有一点,将患者送到运动生理学实验室去测试他的运动耐量的成本,可能要比单独测试某一种基因变体高得多。然而,我们无法将测试方法的直接性和它所花费的成本进行比较(如果运动耐量测试的成本比基因测试低得多,那我们可能更倾向于先测试运动耐量,尽管这种测试方法是间接的),除非我们知道这些因素之间潜在的因果关系。因此,即便我们只想预测谁会赢得大选,或者某个病人患某种疾病的风险有多大,只要了解了那些因素为什么具有预测作用,就能够提高决策的准确性并降低决策的成本。

现在,我们想知道为什么有些事件是相互关联的。视力模糊和体重下降之间有什么联系?如果只知道这两个症状经常相伴出现,是无法得出更多信息的。只有找到导致这二者的共同原因——糖尿病——我们才能理解它们之间的关联。很明显,在这类事件中,我们要找到事情发生的原因,而这也是我们一直在做却极少深入研究的事。

也许你曾看过有关“食用红肉的人群死亡率更高”的研究,但如果你不知道其中的原因,那这些信息就是不可用的。也许吃红肉的人喜欢饮酒或不爱运动,这些都是影响死亡率的因素。而且,即便死亡率的升高真的是红肉引起的,与其他因素无关,那也要根据具体情况来决定用何种方法来降低这种风险。如果死亡率的升高是不卫生的烧烤方式造成的,那我们可以换一种烹调方法;如果是吃红肉本身引起的,那我们就只能让自己成为素食主义者了。我们想知道的不仅是红肉是否与死亡率有关,而是红肉是否真的会提升死亡率。我之所以格外强调这种说法,是因为报纸的科学版块几乎每周都会写一些与饮食和健康相关的内容,比如鸡蛋能引发/预防各种病痛,咖啡会提高/降低死亡的风险。这类研究有时可能不仅会提供某件事与某类人群之间的相关性,还会提供一些其他证据,但是,所有这类研究都值得怀疑,我们要对每一个细节进行批判性的考证,尤其是要用这些结论来指导各种政策和行为的时候(第9章将进行讨论)。

有些时候,我们要去解释一些事件发生的原因。你上班为什么迟到了?某人为什么生病了?为什么一个国家入侵了另一个国家?在这些情况下,我们想知道是谁或者是什么因素引发了某个事件。迟到与交通有关;随着年龄的增长,人们会患各种疾病;很多战争都是由于人们在意识形态上存在分歧。但这些并不能告诉我们上述事件发生的原因。你迟到可能是因为汽车抛锚了,Jane生病可能是因为食物中毒,某场战争可能是领土或资源争端引起的。

找到事件发生的根源很重要,它不但会影响政策的制定(如果Jane生病的原因是餐厅的卫生条件太差了,那她可以不再去那家餐厅吃饭,但无须避讳那天所吃的食材)与责任的归属(谁该为Jane的病情负责),还会影响人们对某件事的反应。很多疾病的症状可能与服用治疗该疾病的药物后产生的症状相同。比如说,慢性肾病会导致肾衰竭,但在极少数案例中,治疗慢性肾病的药物可能会对肾造成同样的损伤。如果门诊医生看到患有肾病的人同时也在服用会导致肾损伤的药物,那他就需要明确这个病人的肾病是否是由服用的药物导致的,这样才能为病人制定正确的治疗方案。虽然知道了服用某些治疗肾病的药物也可能导致肾损伤,但医生无法仅根据这一点就确认某个病人是否属于这种情况。只有在确认病人是否属于这种情况后,才能决定是否要让病人停止服用这种药物。

因果关系最重要的用途是可以用来干预某些事情的发生。我们不仅想知道某些事件为什么会发生,更想利用这些信息来预防或促成某些结果的产生。你可能想知道如何通过改变饮食习惯来改善身体的健康状况。需要服用维生素吗?要坚持吃素吗?还是要戒掉含碳水化合物的食物?如果这些干预措施并不能带来你想要的结果,那就没必要做这些费时又费力的改变。同时,我们还需要考虑这些干预措施的成效如何。也许你听说某个节食方案的减肥成功率是100%。在基于这句话做出任何决策之前,你应该先了解一下这个节食方案究竟帮助人们减掉了多少体重,不同的人减掉的体重差是多少,这个节食方案的效果和其他节食方案相比有何差别(仅通过自己有意识地控制饮食也是可以减肥的)。我们既要评估已经采取的干预措施是否有效(纽约市在发布食物的卡路里值后,是否改善了市民的健康状况),也要预测将来可能会采取的干预措施的效果(如果减少快餐中的钠含量,会出现什么情况)。

政府部门必须知道他们的政策会对民众产生什么样的影响,并且必须制定出能满足民众需求的政策。比如,研究人员发现含钠量高的食物与肥胖症有关联。于是,立法人员决定颁布一项法案,旨在减少餐厅食物和包装食品的含钠量。如果含钠量和肥胖症之间的唯一联系是,高热量的快餐食品导致了肥胖症,而这些食品又正好含钠量高,那么这项法案将不会产生任何作用。人们依然会购买快餐,而快餐才是一开始就应该关注的问题。我们必须保证我们的干预措施针对的是真正影响结果的原因。如果我们只干预了一些与结果相关的因素(比如通过禁止使用火柴来减少死于因吸烟导致的肺癌的人数),那这样的干预措施是不会有效果的。

如果干预措施还有副作用的话,那么情况就更加复杂了,这一点我们后面再讨论。因此,我们不仅要知道造成某个结果的原因,还要知道这个结果会带来什么影响。比如,增加运动量会导致体重下降,但是“补偿效应”又会导致人们去摄入更多的热量,甚至比他们消耗掉的热量还要多(于是他们的体重不降反升)。所以我们要做的不是去寻找个体变量之间的单一联系,而是要对事物间各种相互关联的关系有一个更为宏观的认识。