统计挖掘与机器学习:大数据预测建模和分析技术(原书第3版)
上QQ阅读APP看书,第一时间看更新

11.3 SOW_q计算过程

AMPECS是最大的九家商业信用卡公司之一,正在寻找一个能助其在高消费商业客户之间高效开展成功市场营销活动的SOW模型。AMPECS希望能够使用行业标准SOW,但不想使用抽样调研数据。我构建了这个SOW_q模型,以替代需要使用抽样调研数据的SOW模型。采用SOW_q近似性假设是可行的,通过用加权AMPECS总支出修正竞争对手的总支出估计值,可以得出SOW的能可靠使用的估计值和预测结果。

AMPECS用的2016年5月全月(开票周期)数据包含了6个行业(服务、通信、娱乐、商品、用品和旅游)商业客户交易数据的一个样本(样本量30 212)。每个品类的客户采购(TRX)情况见表11.1,表中给出了10个随机选择的客户。类别TRX是个二值变量,表明客户是否在这个品类进行了采购(有=1/无=0)。最后一栏是使用品类,即统计有采购的品类数量。

表11.1 每个品类的采购(有=1/无=0)和已采购品类数

每个客户的采购品类数量介于4~6。有4个客户采购了5~6个品类,有2个客户采购了4个品类。值得注意的是,在5个客户中,有3个(18065、2060和20947)采购了相同的品类。