当公司比客户更理解客户
数据挖掘有时会使企业获得相对于消费者的决定性信息优势。你可能不太清楚你在预付汽油费用时可能在油箱里留下多少汽油,但赫兹公司在分析了太字节量级的销售数据后比你更加清楚这一点。辛格勒知道你超出“不限时段分钟数”或留下一些未用分钟数的概率。百思买知道你根据延保索赔的概率。百视达知道你延期返还录像带的概率。
在上述这些例子中,各公司不仅知道某种行为的总体概率,而且可以非常准确地预测每个消费者可能具有的行为。大规模数据挖掘的力量使人想到了《诗篇》139篇开头令人毛骨悚然的话语:
你寻找我,便知道我。
你知道我何时坐下,何时站起;你从远方感受我的思想。
你晓得我的外出和躺卧;你熟悉我的一切。
我们可能拥有自由意志,但数据挖掘会使企业变成像全能上帝一样的存在。实际上,通过超级数据挖掘,公司对你的行为预测有时比你自己的预测还要准确。
不过,对于公司可能占据的优势,我们可能只需要确保消费者知道数据挖掘的存在,而不是试图阻止统计分析。这些预测模型的出现意味着公司可能需要承担新的告知义务。通常,政府只要求公司向消费者告知他们的产品或服务(“日本制造”)。现在,公司对消费者的了解有时比消费者还要多。我们可以要求公司向消费者告知关于自身的信息。在你同意为汽油预付费用之前,如果安飞士租车告诉你,与你类似的人在还车时往往会留下超过三分之一的汽油,这对你可能有利——你会知道预付汽油的有效价格是每加仑四块钱。或者,当威瑞森的统计模型认为你在使用错误的电话方案时,他们可能需要通知你。
政府也可以对它的一些大型数据集合进行超级分析,以便向人民提供关于他们自身的信息。实际上,超级数据分析也许可以真正促进政府的改革。如今的国税局几乎遭到了所有人的唾弃。不过,国税局的海量信息可以为人们提供帮助,前提是它愿意分析并公布结果。如果人们将国税局看作有用信息的来源,世界会变成什么样呢?国税局可以告诉某家小企业,它的广告支出可能太多了。或者,国税局可以告诉某个人,平均而言,他这种收入水平的纳税人会做出更多的慈善捐助,或者在个人退休账户里存上更多的钱。哎,国税局甚至可以比较准确地估计出小企业(或者婚姻)的失败概率。实际上,据我所知,维萨卡已经在根据信用卡支出预测离婚概率了(以便更好地预测违约风险)。当然,所有这些与奥威尔笔下的世界有点类似。我可能不太希望收到国税局的通知,说我的婚姻面临风险。(我们稍后会考虑所有这些超级数据分析是否真的有价值。对私密问题进行准确预测的可能性并不意味着我们应该这样做。)不过,我可能至少希望有选择地让政府对我生活的各个方面做出预测。我们可以将国税局看作信息提供者,而不是单纯的收费者。我们甚至可以将国税局更名为“信息税收服务局”。