人工智能与大数据技术导论
上QQ阅读APP看书,第一时间看更新

3.6 大数据的商用途径

前面阐述了大数据相关的定义与相关技术,那么大数据怎么转变为商业价值呢?下面我们从数据使用的几个层面来描述。

3.6.1 数据化

首先必须有数据,就是大数据的采集与存储。很多时候,如果我们连数据都没有,大数据只能是空中楼阁。所以,一个想要做大数据的政府部门或企业,必须先想办法拥有数据,或者采集、爬取、购买数据。

其次是数据互通互联。比如一个企业内部存在很多信息孤岛,信息孤岛之间必须打通,形成统一的大数据平台。最好的办法其实就是企业建立一个统一的大数据平台,当所有的数据上传到这个大数据平台后,数据自然就打通了。互联其实就是数据的标准,如果想让不同的数据源可以相互关联,形成更大的效应,就得有数据标准。数据标准不仅仅可以指导ETL过程中的数据清洗、数据校验,好的数据标准还可以使得无线的数据跟PC的数据相互关联互通,甚至企业之间的数据关联互通。

这些过程可以称为数据化的过程,也就是大数据的基本要素——数据的形成。

3.6.2 算法化

有了数据,就可以加工使用了。严格意义上说,是指采用大数据的相关技术对大数据进行加工、分析,并最终创造商业价值的过程。在这个过程中,最核心的就是算法。我们提到算法时,往往也会谈到引擎,仅仅提引擎一词,更多想到的可能是汽车的发动机。汽车引擎无论多复杂,其实输入、输出是很简单的,需要的是汽油+空气,输出动力(汽油的能量)。大数据的引擎可能是一组算法的封装,数据就是输入的汽油,通过引擎的转换输出数据中的能量,提供给更上层的数据产品或者服务,从而产生商业价值。

算法是“机器学习”的核心,机器学习又是“人工智能”的核心,是使计算机具有智能的根本途径。在过去10年里,机器学习促成了无人驾驶车、高效语音识别、精确网络搜索及人类基因组认知的大力发展。从根本上来说,数据是不会说话的,只有数据没有任何价值。如果拥有大量的数据,而不知道怎么使用,就好像“坐在金山上要饭”。算法其实指的是如何在业务过程中有效利用数据。在不远的未来,所有业务都将成为算法业务,算法才是真正打开数据价值的密钥。当算法迭代优化时,决定其方向的不仅是数据本身的特性,更包含我们对业务本质的理解和创造新业务。这就是我们称算法为“引擎”而非“工具”的关键理由,它是智能的核心。基于数据和算法,完成“机器学习”,实现“人工智能”。

3.6.3 应用化(产品化)

把用户、数据和算法巧妙地连接起来的是数据应用(或数据产品),这也是大数据时代特别强调数据产品重要性的根本原因。最终,大数据的成功最关键的一步往往是一个极富想象力的创新应用。智能化数据产品的要求是非常高的,不仅仅是与最终用户形成个性化、智能化的交互,而且还要有完好的用户体验与突破的技术创新。比如金融行业的“秒贷”,就是基于算法的数据智能实时发挥作用,最终实现秒级放贷,这个是传统的金融服务没法想象的。这样的智能商业才是对传统商业的颠覆。

比如,大数据营销是一个热门的大数据应用。对于多数企业而言,大数据营销的主要价值源于以下几个方面。


● 市场预测与决策分析支持

数据对市场预测及决策分析的支持,早就在数据分析与数据挖掘盛行的年代被提出过。沃尔玛著名的“啤酒与尿布”案例就是那个时候的杰作。只是由于大数据时代上述Volume(规模大)及Variety(类型多)对数据分析与数据挖掘提出了新要求。更全面、速度更及时的大数据必然对市场预测及决策分析上一个台阶提供更好的支撑。要知道,似是而非或错误的、过时的数据对决策者而言简直就是灾难。


● 发现新市场与新趋势

基于大数据的分析与预测,对于企业家洞察新市场与把握经济走向都是极大的支持。例如,微软研究院通过大数据分析对奥斯卡各奖项的归属进行了预测,除最佳导演外,其他各项奖的预测全部命中。


● 客户分级管理支持

面对日新月异的新媒体,许多企业想通过对粉丝的公开内容和互动记录的分析,将粉丝转化为潜在用户,激活社会化资产价值,并对潜在用户进行多个维度的画像。大数据可以分析活跃粉丝的互动内容,设定消费者画像的各种规则,关联潜在用户与会员数据,关联潜在用户与客服数据,筛选目标群体做精准营销,进而可以使传统客户关系管理结合社交数据,丰富用户不同维度的标签,并可以动态地更新消费者的生命周期数据,保持信息新鲜有效。


● 大数据用于改善用户体验

要改善用户体验,关键在于真正了解用户及他们使用你的产品的状况,做最适时的提醒。例如,在大数据时代,或许你正驾驶的汽车可以提前救你一命。只要通过遍布全车的传感器收集车辆运行信息,在你的汽车关键部件发生问题之前,就会提前向你或4S店预警,这决不仅仅是节省金钱,而且对保护生命大有裨益。事实上,美国的UPS快递公司早在2000年就利用这种基于大数据的预测性分析系统来检测全美60000辆车辆的实时车况,以便及时地进行防御性修理。


● 企业重点客户筛选

许多企业家纠结的事是,在企业的用户、好友与粉丝中,哪些是最有价值的用户?有了大数据,或许这一切都可以更加有事实支撑。从用户访问的各种网站可以判断其最近关心的东西是否与你的企业相关;从用户在社交媒体上所发布的各类内容及与他人互动的内容中,可以找出千丝万缕的信息,利用某种规则关联及综合起来,就可以帮助企业筛选重点的目标用户。


● 竞争对手监测与品牌传播

竞争对手在干什么是许多企业想了解的,即使对方不会告诉你,但你却可以通过大数据监测分析得知。品牌传播的有效性亦可通过大数据分析找准方向。例如,可以进行传播趋势分析、内容特征分析、互动用户分析、正负情绪分类、口碑品类分析、产品属性分析等,可以通过监测掌握竞争对手的传播态势。


● 精准营销信息推送支撑

精准营销总在被许多公司提及,但是真正做到的少之又少,反而是垃圾信息泛滥。究其原因,主要是过去名义上的精准营销并不怎么精准,因为其缺少用户特征数据的支撑及详细准确的分析。相对而言,现在的RTB(Real Time Bidding,实时竞价)广告等应用则向我们展示了比以前更好的精准性,而其背后靠的就是大数据支撑。


● 用户行为与特征分析

只要积累足够的用户数据,就能分析出用户的喜好与购买习惯,甚至做到“比用户更了解用户自己”。有了这一点,才是许多大数据营销的前提与出发点。无论如何,那些过去将“一切以客户为中心”作为口号的企业可以想想,过去你们真的能及时、全面地了解客户的需求与所想吗?或许只有大数据时代这个问题的答案才更明确。


● 品牌危机监测及管理支持

新媒体时代,品牌危机使许多企业谈虎色变,然而大数据可以让企业提前有所洞悉。在危机爆发的过程中,最需要的是跟踪危机传播趋势识别重要参与人员,方便快速应对。大数据可以采集负面定义内容,及时启动危机跟踪和报警,按照人群社会属性分析聚类事件过程中的观点,识别关键人物及传播路径,进而可以保护企业、产品的声誉,抓住源头和关键节点,快速有效地处理危机。

3.6.4 生态化

大数据时代将催化出大数据生态。基于底层的技术平台,上层开放则可以形成丰富的生态。通过开放式的平台凝聚行业的力量,为更多的企业和个人提供大数据服务。大数据生态表现在以下两个方面。


● 数据交换/交易平台

人工智能的基石就是数据,作为人工智能的第一要务,数据是最重要的。数据作为生产资料,好比汽车的汽油,没有汽油,再高端的汽车也无法运转。而数据的来源往往是多方面的,未来一个企业所用到的数据往往不仅仅是自身的数据,甚至是多个渠道交换、整合、购买过来的数据。对于大数据商业形态,数据一定是流动的,数据只有整合关联,才能发挥更大的价值。但是数据要实现交换、交易,我们最终所必须解决的是法律法规、数据标准等一系列问题。


● 算法经济/生态

算法是人工智能应用的基石,是大数据的核心价值。多个机器学习算法可以结合起来成为更强大的算法,从而更好地分析数据,充分挖掘数据中的价值。Gartner认为,无可避免地,算法经济将创造一个全新的市场。人们可以对各种算法进行买卖,为当下的公司汇聚大量的额外收入,并催生出全新一代的专业技术初创企业。想象这样一个市场:数十亿的算法都是可以买卖的,每一个算法代表的是一种软件代码,能解决一个或多个技术难题,或者从物联网的指数级增长中创造一个新的机会。在算法经济中,对于前沿的技术项目,无论是先进的智能助理,还是能够自动计算库存的无人机,最终都将落实成为实实在在的代码,供人们交易和使用。

广义的算法存在于大数据的整个闭环之中,大数据平台、ETL(数据采集、数据清洗、数据脱敏等)、数据加工、数据产品等每一个层面都会有算法支持。算法可以直接交易,也可以包装成产品、工具、服务,甚至平台来交易,最终形成大数据生态中的一个重要组成部分。人们将会通过产品使用的算法来评价它的性能好坏。企业的竞争力也不仅仅在于大数据,还要有能够把数据转换为实际应用的算法。因此,CEO应该关注公司有产权的算法,而不仅仅是大数据。正在涌现的机器学习平台可凭借“模型作为服务”的方式,托管预训练过的机器学习模型,从而令企业能够更容易地开启机器学习,快速将其应用从原型转化成产品。企业接入并使用不同的机器学习模型和服务以提供特定功能的能力将变得越来越有价值。

所有的这一切最终也离不开云计算,数据平台天然就是基于云计算来实现的。而数据交换、算法交易则需要一个商店,云端就是目前最好的商店。无论是数据的互通,还是基于云端预训练、托管的机器学习模型,都将促使每个公司的数据产品能够大规模地利用算法智能。