1.2 大数据的本质
所有技术的发展都是为社会进步服务的,大数据技术也不例外。但是,大数据技术对社会生产的促进作用是变革性甚至是颠覆性的。
“大数据商业应用第一人” Viktor Mayer-Schönberger在其著作《大数据时代》中,前瞻性地指出,大数据正在变革我们的生活、工作和思维。大数据开启了一次重大的时代转型,为我们带来了思维变革、商业变革和管理变革。其中最重要的三个思维变革颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。
(1)全样本
我们将使用更多的数据甚至是全部数据来进行分析,而不再采用随机样本。从可能性角度,当前的技术能力已经可以支撑海量数据的处理;从必要性角度,有时候数据分析的目的就是要发现大量正常数据中的少数异常情况,例如跨境汇款中的异常交易,这无法通过采样分析获得。
(2)概率化
我们将不再沉迷于精确性,而是允许劣质数据混杂其中。大数据时代不可能实现精确,反之用概率来表示事物发展的大方向,混杂性变成了一种标准途径。
(3)相关性
我们将更关心相关关系,因果关系被放到次要的位置。在很多场景下,“是什么”比“为什么”对决策的帮助更大,可以在快速变化的环境中帮助你先发一步。甚至,在一些不知道“为什么”的场景下,知道“是什么”反而有助于人们取得发现“为什么”的突破。
基于这种思维发展起来的大数据技术,具有以往的各种技术不具备的准确性和实时性优势,当它应用到社会各行业生产中时,对社会生产效率的提升是异常显著的。
很多人对于大数据应用的认识,都始于Google对于流行性疾病的成功预测。Google利用当前人们喜欢上网搜索解决方案(如搜索流感症状或者治疗药物)的习惯,找出了对应时段内某些特定字段的搜索频率与美国疾控中心历史记录中某些流行性疾病在空间和时间上的相关性,并据此而建立了一个数学模型。利用这个数学模型,Google成功预测了2009年H1N1流感的发展过程。
而这个成功应用带来的振奋远不止如此。首先,作为一家互联网公司,Google在与其毫无关联的医学专业领域获得了成功;更重要的是,它的预测在准确性特别是实时性方面,远远超过专业的美国疾控中心。
于是,更多的人在更多的行业开始了大数据应用尝试。
在零售业:梅西百货(Macys)已经实现对多达7300万种货品进行实时调价,以实现销量和利润的双重最大化;塔吉特(Target)公司通过对用户历史消费记录的大数据分析,实现对用户下一阶段消费行为的预测,从而实现精准投放。
在博彩业:Tipp24 AG公司用KXEN软件来分析数十亿计的交易以及客户的特性,然后通过预测模型对特定用户进行动态的营销活动。这项举措减少了90%的预测模型构建时间。
在通信业:中兴通讯创新性地提出了基于大数据技术的电信系统反馈环理念,让电信网络作为一个整体获得实时的系统反馈,从而使网络性能更加稳定,网络运维更加高效;而全球120家运营商中,已经有48%的企业正在实施大数据战略,通过提高数据分析能力,他们正试图打造着全新的商业生态圈,实现从电信网络运营商(Telecom)到信息运营商(Infocom)的华丽转身。
在金融业:阿里通过对用户消费习惯的大数据分析,已经可以将余额宝第二天的赎回规模的预测准确率保持在97%以上,连“双十一”等大促销造成的大规模资金流动也不例外;中信银行与中兴通讯大数据平台强强联合,打造一个全新的“数据银行”,利用金融大数据更科学地实现加强风险管控、精细化管理、业务创新等业务转型。
在公共管理行业:中兴通讯为2014南京青奥会打造的“环宁护城河”项目,将各种警务数据在大数据平台上集中处理,从时间和空间两个维度进行实时统计和展现,为青奥安保工作部署提供科学的决策依据。
越来越多的实践证明,大数据运用可以为各个行业带来巨大的收益。
麦肯锡在它的报告中,根据各行业利用大数据技术获取利益的潜力,将各个行业分为5个组别。
(1)计算机和电子产品及信息行业必然能够从大数据中获取巨大利益,该行业本身就有巨大的信息池且具有快速创新的特点,与大数据天然吻合。
(2)社会公共管理及金融业则需要通过细分和自动化算法来克服技术障碍,从而大为受益。
(3)建筑、教育服务、艺术和娱乐等行业则面临着获取海量数据价值的系统障碍。当然,如果这些障碍是可以克服的,则也可以从大数据中获益。
(4)制造业、批发贸易等行业全球交易程度高,如果能够克服数据和技术上的障碍,则从行业普遍意义上讲获益巨大,但面临的困难同样不小。
(5)零售、医疗、住宿和食物等本地服务行业全球交易程度低,则从行业普遍意义上讲,从大数据中获取价值的潜力相对较小。