1.4 电子商务数据运营的五大应用
估测(Estimation)和预测(Prediction)是数据分析中比较常用的应用。估测应用是用来猜测现在的未知值,而预测应用是预测未来的某一个未知值。估测和预测在很多时候可以使用同样的算法。估测通常用来为一个存在但是未知的数值填空;而预测的数值对象发生在将来,往往目前并不存在。
举例来说,如果我们不知道某人的收入,可以通过与收入密切相关的量来估测,然后找到具有类似特征的其他人,利用他们的收入来估测未知者的收入和信用值。还是以某人的未来收入为例来谈预测,我们可以根据历史数据来分析收入和各种变量的关系以及时间序列的变化,从而预测其在未来某个时间点的具体收入会是多少。
估测和预测在很多时候也可以连起来应用。比如我们可以根据购买模式来估测一个家庭的孩子个数和家庭人口结构;或者根据购买模式,估测一个家庭的收入,然后预测这个家庭将来最需要的产品和数量,以及需要这些产品的时间点。
对于估测和预测所做的数据分析可以称作预测分析(Predictive Analysis),而因为应用非常普遍,现在预测分析被不少商业客户和数据挖掘行业的从业人员当作数据挖掘的同义词。
我们在数据分析中经常听到的回归分析(Regression Analysis)就是经常被用来做估测和预测的分析方法。所谓回归分析,或者简称回归,指的是预测多个变量之间相互关系的技术,而这门技术在数据挖掘中的应用是非常广泛的。在第3章中的分类算法和序列算法都可以运用到回归的技术。
传统企业在做营销的时候,经常通过市场调研、电话访谈和调查问卷等方式来发现潜在的客户。但是客户一般不愿意主动透露自己过多的私人信息或者随意作答,市场调查所得到的信息可能不符合事实,从而造成一种假象。此外,这些调研的对象数量不可能太多,未必具有代表性,可能只反映了局部市场信息。而在互联网上,我们可以直接根据客户的行为发掘出他们的真实信息和兴趣所在。
身处大数据时代,营销必然会更多地依赖数据,以便更精准地找到目标客户并留住客户。对来自于不同平台的数据进行进一步挖掘和分析,找到这些数据相对应的人群,再将这些群体进行个性化的对比,并以此展开个性化的营销服务,是掌握客户的根本。例如,利用针对合适的人群发送EDM,或者流量对接,抑或跟传统搜索结合等方式引入新客户,进而对于这些客户行为进行数据分析,尽量把新客户转化成优质的活跃客户,提高客户的消费。
仔细分析我们在电子商务网站上拥有的海量数据使得我们可以把人分成很多有自己独特属性的群体,针对每个群体给予不同的服务。而数据分析和挖掘主要侧重于如何找到我们关注的客户属性,总结出客户需求,以及将数据转化为对客户有帮助的信息。我们将数据分析和挖掘在电子商务中的主要应用总结成五条,用下面的五个小节来分别解释。