1.3.1 电商是怎么做推荐系统的
电商可以说是互联网行业在广告之外的又一个里程碑式的盈利模式。目前,亚马逊、淘宝、京东和后起之秀拼多多是电商领域的佼佼者。毫无疑问,推荐系统对这几家电商公司都起到了巨大的作用,特别是亚马逊,据其财报披露,与推荐系统相关的收益占到了其年收益的40%。下面详细介绍推荐系统在各家电商公司的应用。
这里先问大家一个问题:好的推荐系统具有什么特点?一些人会说,好的推荐系统要能够帮助公司提高点击率(Click Through Rate, CTR),让更多的用户去点击;也有一些人会说,好的推荐系统还必须帮助公司提高转化率(Conversion Rate, CVR),让用户尽可能地买商品,提高成交;还有一些人会说,好的推荐系统还要探索出用户的潜在兴趣,让用户一直具有新鲜感,延长用户的留存时间。不过在笔者看来,最好的评价指标只有一个,就是用户满意度。因为很多时候我们得不到纸面的用户满意度,所以用CTR、CVR、观看6s、接通电话30s、评论、点赞、收藏和多样性覆盖率等一系列指标作为用户满意度的替代指标。
1.图书电子商务推荐系统案例
著名图书电子商务网站A的推荐开始是基于评分标准的,具有1~5星的评价等级(见图1-1)。此评价等级代表了用户满意度,可以说仅凭这一点,该网站的推荐效率就会比其他仅以点击或者成交为目标的推荐系统高不少,原因是用户给出了反馈,而足够多且全的反馈是优化推荐系统的最佳利器。当然,这种评价体系并非没有缺点,它的一个明显缺点是增加了用户的操作流程,拉低了用户体验。
图1-1 著名图书电子商务网站A的推荐页面(1)
在进入图书电子商务网站A的主页后,因为不知道选择什么书,笔者就随机点击了文学类图书,此时网站展示的是热门书单,如图1-2所示,图中的4张图片主要介绍了一些热门书和一些广告书。展示热门书很好理解,在推荐过程中,对于新用户,因为系统没有收集到他们的喜好,所以需要采取一些措施,尽可能地去推荐一些他们感兴趣的物料。这样的措施一般称为冷启动。冷启动的常用方法有基本信息冷启动、热门冷启动、EE(探索和利用)冷启动和外部数据接入冷启动等,而图1-2所示的正是热门冷启动的一种表现形式,热门冷启动是最常用的冷启动方式。
图1-2 著名图书电子商务网站A的热门书单
热门商品具有聚焦效应,往往一出现就能够吸引用户的目光,从而引发用户产生行为(如点击)。从另一个角度来说,即便用户没有产生行为,也是一种反馈,这证明用户对这一类商品不感兴趣。
接下来滑动鼠标看看它展现了什么。从图1-3可以看到,在展现的商品中,1/3是没有评分的,2/3是有评分的。之前介绍过图书电子商务网站A一开始的推荐系统是基于评分系统的,那么为什么还要给用户推荐没有评分的商品呢?有两点原因:
❑ 并不是所有的商品都有评分,没有评分的商品也要有曝光的机会。
❑ 没有评分的商品中有大量用户感兴趣的物料。
通过图1-3和图1-4可以看到,所展现的12个商品中,有4个是没有评分的。这些商品首先是用户可能感兴趣的,其次是尽管这些商品并没有评分,但是可能得到了一定的点击量和交易量,所以被曝光给了用户。不过没有评分的商品只占了1/3的比例,而后面有评分的8个商品占了2/3的比例,原因是:
❑ 在模型预估中,用户对这几件商品比较感兴趣(被点击的概率很大)。
❑ 它们已经被其他用户使用过且获得了不错的评价(增大点击概率和成交概率)。
图1-3 著名图书电子商务网站A的推荐页面(2)
图1-4 著名图书电子商务网站A的推荐页面(3)
从上面的案例中可以认识到,图书电子商务网站A的主要推荐位分为两部分,一部分是热门推荐和广告推荐,另一部分是个性化推荐。个性化推荐又分为冷门个性化推荐和热门个性化推荐。
先谈谈为什么需要热门推荐。热门推荐的作用是让新用户有一些不错的选择。比起随机推荐,热门推荐显然是更好的选择:对于用户来说,可以有一个不太差的体验;对于平台来说,可以快速收到用户的反馈,建立用户画像,了解用户的兴趣。
再来介绍广告推荐。毫无疑问,广告推荐是平台获利的工具。商家付钱,平台将广告展现给用户。一般来说,广告会伤害用户的体感,但是因为个性化的存在,推荐系统有能力把用户感兴趣的广告推送到用户面前,将用户不感兴趣的大部分广告过滤掉,从而最大限度地降低广告对用户体验的伤害。
最后讲讲个性化推荐。个性化推荐主要利用推荐算法根据用户画像进行推荐,其中,冷门个性化推荐是从不太热门的物料中获取的,热门个性化推荐是从热门物料中获取的。那么,两者的区别在哪里呢?
其实在个性化推荐中,追求的是最大化用户的舒适感。如果一味地推荐热门物料,那么用户很快就会因为内容太过单一而感到厌倦(因为热门物料的数量并不多),所以就有了个性化。对于个性化来说,用户更喜欢反馈数据比较全面的同时有自己喜欢的物料,也就是所谓的热门个性化物料。这部分物料也是用户容易点击和成交的,所以它们在推荐栏占的比例较大。但是冷门个性化物料也比较重要,虽然它们的热度不高,但是它们大概率是用户感兴趣的,因此也值得被推荐。只是相对热门个性化物料来说,它们的点击率和成交率要低一点,所以展现时占比也要低一些。
当然上述展现策略并不是唯一的,可能在不同的页面有不同的展现策略,甚至针对不同的用户有不同的展现策略。如对于高活用户来说,系统可能会让他们接触更多的冷门个性化物料,因为他们可能早就对热门个性化物料熟记于心了。
对于平台来说,也需要给一些冷门个性化物料曝光机会,让一些有潜力的物料有机会变为爆款,这就是所谓的“保量”。在点击和成交损失不大的情况下,保量措施对平台和用户是双赢的。
综上,从网站A的案例可以看出,推荐系统是一套比较复杂的业务逻辑,它不仅考虑把用户的个性化做好,还兼顾广告盈利和用户体验的博弈衡量、物料的曝光保证、用户兴趣的探索、成交和兴趣的平衡等。
2.电商推荐案例分析
由图1-5所示的某著名电商App A的推荐首页可以看出,其推荐分为两部分,一部分是搜索框的推荐,另一部分是商品列表卡的推荐。
搜索框背后的推荐算法目前官方并没有对外分享,不过笔者可以根据经验进行一定程度的解读。
❑ 因为搜索框显示的是文字推荐,因此,其推荐逻辑主要来自搜索算法。
❑ 搜索推荐应该主要来自用户的搜索历史和用户点击物料的文本描述,其架构应该类似于常用的搜索架构,包括召回和排序。
❑ 召回应该是多路召回,主要来自搜索历史查询的改写召回、搜索历史查询的相似召回、搜索历史查询的归一化扩散召回、用户点击物料文本相似召回、用户偏好类目热门物料召回、点击物料图片召回等。
❑ 排序时主要根据用户特征和“物料文本+物料基础特征”进行打分,最后进行推送。
❑ 商品列表卡的推荐包括前文所提及的冷启动—召回—粗排—精排—重排5个部分。从个人体验来看,其主要与用户推荐历史点击物料、成交物料和物料的热度有关,但是每个商品卡位置的功能并不是一样的,除了个性化的位置展现外,还有多样性商品展现、热度商品展现,甚至还有一些产品经理认为的比较有价值的物料的展现。当然这些商品展现的比例,对不同的物料是刷新一次展现一次还是刷新多次展现一次,都是需要慎重考虑和验证的。而且对于个性化商品推荐来说,在大多数时候并不将精排点击打分作为最后的排序分数,而要结合成交得分、留存得分、物料的生命周期、点击率和转化率等一系列打分进行排序。
图1-5 某著名电商App A的推荐首页
不可否认的是,目前上述电商App的体验还是相当不错的,其推荐的物料基本可以命中用户的兴趣目标,而且物料的重复性比较低。不过该电商目前的推荐也不是完美无瑕的,比如另一个著名电商App P就在此基础上增加了一些特殊物料拓展措施。App P的推荐系统在命中用户兴趣的基础上会进行一种特殊的拓展,即进行二次推荐,那么这个特殊的拓展是什么呢?举个例子,某个用户搜索了手机或者点击了手机相关物料,App P就会在此基础上推荐一些与手机相关的配件,如360°无死角自拍杆。
除了搜索框的推荐和商品列表卡的推荐外,电商App S也极其注重用户的体验。如图1-6所示,在用户进行多次刷新之后,手淘App会留下“用户调研”框对推荐的这次会话进行反馈收集,以便后续优化。另外,不要以为展现的商品列表卡全是个性化推荐,一般来说,在一次展现中会有一个物料属于广告推荐。广告推荐是另一个比较深的领域,是区别于个性化推荐的单独、成体系的推荐系统。
图1-7是电商App J的商品推荐页面,总的来说,其展现的内容和App S大同小异,只是App S倾向于展示商品的成交量,而App J则倾向于展现商品的浏览次数。京东App背后的推荐算法和流程也没有官方分享,不过从App J的相关论文来看,其背后的逻辑和App S是大同小异的,还是以个性化为主,以运营规则为辅,此处不做赘述。
图1-6 App S的推荐页面
图1-7 App J的商品推荐页面
事实上,通过以上的电商推荐案例可以发现,现在的商品推荐不只是推荐商品那么简单,它通过不停地展现用户感兴趣的商品,让用户留在App内,从而产生点击和消费。它不只展现静态的商品图片和文字,还会展现商品的视频,甚至插入商品的直播卖货。而且,其中不仅有商品展现,还会插入其他业务,比如插入广告和直播。因此,商品推荐信息流最终展现给用户的是复杂的信息流,包含多个业务场景展现的商品卡。怎么对其进行合理的混排,让各方利益达到最优,是一个很复杂的问题。