广告与营销风控:方法与实践
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.1.5 流量质量和无效流量

获取高质量的流量是互联网广告营销行业所面临的一大挑战。高质量流量能够为广告主带来更高比例的后链路成交转化率,而真实的用户和信息也是互联网营销行业持续向前稳步发展的基础。如果营销生态中的流量质量无法保障,那么一方面广告主的利益会受损,花重金投出去的广告带不回任何预期内的成交转化;另一方面对营销行业也是一种慢性损害,虚假和恶意流量一旦泛滥成灾,便会对正常流量造成包围和侵蚀,不仅严重影响平台形象,还会失去用户信任,进而引发劣币驱逐良币的危机。

如图1-4所示,19世纪,百货之父约翰·沃纳梅克(John Wanamaker)曾提出过广告营销界的“哥德巴赫猜想”:“我知道我的广告费有一半是浪费的,但我不知道浪费的是哪一半。”这其实就是广告流量质量参差不齐导致广告主营销预算浪费的一个缩影。就当年而言,因为技术发展的限制,营销平台缺乏人群定向等精准营销能力导致广告“海投”浪费,而时至今日人们依然被这个营销难题困扰,究其原因,很大一部分就是无效流量导致的。

图1-4 广告营销界的“哥德巴赫猜想”

无效流量在广告行业有多个协会和组织定义认定标准,典型的如可信责任组织(Trustworthy Accountability Group,TAG)、互动广告局(Interactive Advertising Bureau,IAB)和中国广告协会(China Advertising Association,CAA)等。

根据中国广告协会认定标准,无效流量(Invalid Traffic,IVT)划分为两种,一种是相对容易识别的“一般无效流量”(General Invalid Traffic,GIVT),另一种是需要借助复杂分析甚至人工介入的“复杂无效流量”(Sophisticated Invalid Traffic,SIVT),如图1-5所示。

图1-5 GIVT和SIVT

GIVT和SIVT的详细特点如下。

1.一般无效流量(GIVT)

相对容易识别,通过使用名单或者其他标准化参数、定义及预先设定的规则便能够检测出来的无效流量。GIVT的特点如下。

●来自数据中心的且不具备明确真实用户特征的流量(即来自服务器的流量而非真实用户的电脑、手机等设备的流量)。

●来自高危设备或者作弊来源IP的流量,如市场上已经几乎不用的机型大量聚集或者在管控黑名单的IP B段、C段等。

●来自声明的机器人或爬虫的流量。

●用户代理信息为空或非浏览器用户代理头及其他形式的未知浏览器带来的流量,一般是程序生成的非正常UA(用户代理)。

●基于广告活动用户行为出现的明显异常的高速、连续或重复请求,严重超出用户正常合理频次的流量,或缺少有效流量的关键数据信息。

●媒体方发起的对广告主提供的点击链接和着陆页面的定期例行检测流量。

●广告主或其代表与媒体方发起的、通过协商约定以测试为目的的流量。

●预获取或浏览器预览且没有指定触发时间的流量(现代的浏览器或App为了更好的用户体验,经常会对用户浏览的内容做预加载,导致广告被动请求)。

●已知的来自高危或者作弊来源App、网站的流量,一般会对媒体做扣量处罚。

●基本信息缺失或不一致的流量(基本信息至少应包含事件类型、广告系列ID、时间戳、IP地址、请求方式、完整用户代理信息)。

2.复杂无效流量(SIVT)

需要通过高级分析、多方协作甚至人工介入等方法,以及广告投放活动以外更大范围的数据信号才能分析和识别的无效流量。SIVT特点如下。

●未声明的、高度模拟真人访客的机器人和爬虫流量。

●广告插件、恶意软件产生的流量。

●被劫持的设备和群控设备产生的流量。

●虚拟化设备中产生的流量。

●被劫持的广告代码产生的流量。

●通过作弊代理服务器产生的流量。

●通过隐藏/堆叠/覆盖或其他方式导致用户无机会看到正常广告内容的流量。

●在不同于主要广告域名的网页内蓄意嵌套并恶意制造的流量。

●以金钱补偿为动机的操纵测量数据的行为。

●伪造的可见性曝光判定属性参数的流量。

●篡改或重复使用窃取获得的Cookie(储存在用户本地终端上的数据)信息或移动装置标识的流量。

●操纵或伪造用户位置数据和相关属性的流量。