2022,我们如何全面衡量广告投放的效果?
如果我们总结2021年品牌广告主眼里的关键词,私域、CDP、DTC、直播、个保法、数据资产、数字化转型,大概率是必须提及的,但每一年总有一些老语汇依然会被反复谈及。例如,广告效果的监测与衡量,作为数字营销的底层问题,虽然并非新事物,但由于其难度所在,一直在优化与升级的路上。
尤其是对于品牌广告的投放,各类衡量广告价值的指标层出不穷,但好像都不太能让人满意。
最初,故事没有那么复杂,广告大部分都是CPT投放的合约广告,广告主对“量”进行度量,由此出现impression、click这样的衡量方式。但广告形式和广告流量变得复杂之后,仅仅衡量“量”是不够的,需要增加对“质”的衡量。再加上数字广告越来越程序化(这意味着广告将更贴近受众的需求进行投放),于是,出现了ROI、TA(目标人群)浓度、TA的N+reach等新的衡量方式。
但这些指标的出现,并不能真正解决问题。广告效果的衡量本质上不可能有放之四海而皆准的通用指标。而且,广告效果衡量往往都是以结果论的,例如:追求效果的广告主,当然会用ROI来衡量效果,但过于追求结果,会忽视达成效果所需要经过的过程。而品牌广告主,曾经也非常喜欢用TA浓度来衡量投放结果,但消费者被广告所影响的程度,却根本不可能从简单的TA浓度来了解。
甚至有些方式本身就是不够科学的。比如TA浓度,如果一次campaign的TA浓度高于另一次,一定能够说明这次campaign的效果更好吗(甚至TA浓度本身到底准确性如何都很难说得清)?
再加上,《个人信息保护法》出台之后,衡量广告价值变得更难了。
方法一直不尽如人意,而外部环境又发生了颠覆性的改变,因此,衡量广告效果的方式,也应该发生根本性的变化。
在找到这些根本性变化的方法之前,我们需要先同意几个重要的理念(当然,不同意这几个理念,这篇文章也没有读下去的必要):
-
过程和结果同样重要,甚至很多时候,过程比结果更重要;
-
广告投放的效果诉求是多样化的,这些多样化的诉求无法用统一方式去衡量;
-
广告效果的衡量需要具有科学性,逻辑上要成立,方法上要严谨。
从这三个理念出发,我们看看今天的广告投放效果应该怎么衡量。
对于不同的广告主而言,什么才算广告的效果,肯定是不同的。
哪怕都投同一种广告,对于什么才算效果,定义和衡量方式也可能是不同的。
总体而言,广告的效果基本上分为以下类型:
1.以转化为最终效果来衡量广告,同时追踪转化过程。
最终效果的衡量往往用ROI或者转化率(当流量价格比较稳定时),转化过程往往需要将后链路数据匹配前链路数据,实现广告全链路归因后才能体现。
2.广告覆盖的人群数量,以及其中多少人真正被企业的品牌所影响,即增强了认知、好感甚至购买意愿。这些共同构成了企业的品牌资产价值。
这是目前最困难的领域。常用的方法是,追踪同一人群一段时间(通常是相当长的一段时间)的行为变化,尤其是与投放品牌相关的互动行为的变化来推测其品牌人群资产的变化。显而易见的是,这样的方法势必需要足够大的人群场、内容场作为支撑,能做到这一点的,基本上只能是大型互联网媒体平台提供的工具。
3.从行业角度看,企业的品牌力在消费者心智中的整体提升。
洞悉品牌力在行业角度的比重,突破常规舆情法或者问卷法的诸多弊端,更及时精确地追踪更广范畴人群的心智变化,来判断人群是否在广告投放后,对广告主品牌具有更多的偏好,或者曾经属于其他品牌的消费者转变为广告主品牌消费者(从对其他品牌拥有更多认知、好感、意愿,转变为对广告主品牌有更多的认知、好感和意愿)。这就对媒体平台提出了更高的要求:缜密的行业及品牌理解力及对于人群的品牌独占行为的把握。
4.对品牌和效果的综合提升。
如果一个广告主说,想追求“品效协同”,我们不能简单认为这是不理性的。广告投放本身提供了“品效协同”的可能性。最常用的方法,是在投放品牌广告的同时追加效果广告,利用不同广告形式,按照一定的节奏(pacing)进行组合投放。但,组合方法的不同,一定会左右广告主所追求的品效协同效果。而在各种组合中找到投放效果的最优解,广告主自己或者广告主聘用的第三方都无法完全实现,因为广告主不可能穷尽所有的投放方式,也就无法确定当前的组合方式一定是最有效的。
在这种情况下,唯有媒体平台,在拥有海量的投放数据的基础上,才能对广告主当前的投放组合的效果做对比性的衡量(与其他各种潜在组合方式进行对比),然后给出当前组合与自有组合或其他组合方式之间的效果差异。显然,这个解只有媒体平台才能提供,而媒体平台如果提供相关工具,便能对广告主衡量组合广告投放的效果,产生极大的价值。
那么,对于上述四种广告投放效果的衡量需求,我们有什么创新解法呢?
今天我们以腾讯广告RACE曝光归因模型为例(以下简称RACE模型),来聊聊行业在衡量广告效果上的努力与成效。
第一类:衡量转化以及转化过程的归因
如同前面所讲,如果只是衡量ROI,对广告投放的效果衡量就只有一个标准:好和坏。
效果不好的广告投放,我们通常能做的事情,是停止投放。
但如同我在我的大课堂(宋星大课堂)所讲述的,效果不好的广告投放,或许仍然隐藏着很大的机会——或许只是在归因上(这个广告很可能为别的广告或者流量渠道做了助攻),或是在人群的匹配上出现了一些问题,但并不能就立即认为这个广告存在严重问题。
举一个案例,某食品品牌旗下有两个主推小食,分别是牛肉和鸡肉,做了一波投放,用同样的资源触达目标受众,牛肉小食的产品线转化远低于鸡肉线。怎么办?
传统的单一转化衡量方式下,尽管是以转化为导向,但肯定相当粗暴,容易产出一刀切的优化方式。终端ROI高,希望起量;ROI不达标,如果做一些优化还不行的话,会停掉或者更换到效果好的鸡肉线广告进行投放。
但显然我们需要用有效的广告衡量来判断,既然牛肉线的效果不好,那么到底问题出在哪里?过去,这样的判断很难实现,但现在的工具(如下图所示,来自RACE模型的衡量方式)则可以很好地帮助广告主洞察到相关情况。
利用RACE模型,结合后链路的人群数据,我们可以有“打开黑箱”般的发现:两个产品的人群重合度很低,只有2%。投放的这波广告,并没有对牛肉和鸡肉产品的人群进行区分,而是统一覆盖了同一组人群。
问题来了,刚好覆盖的这组人群对鸡肉产品更感兴趣,因此简单得出牛肉产品的广告不够好这个结论,是非常武断的。按照这样的错误思维,我们或许很快就能得出下一个同样不正确的结论:假如这个广告下一波投放刚好覆盖的人群对牛肉产品更感兴趣,那就是鸡肉产品的广告不够好。
但是,有了RACE模型,就不会出现这样武断地推导。更高效的机器建模学习,也会让广告效果的优化不再复杂。如果牛肉线的人群不匹配,那么找到匹配的人群,就有机会大幅度提升投放的效果。找到匹配人群的方法,当然也可以利用后链路数据作为正样本,用之前高频触达牛肉广告但仍未转化的人群作为负样本,以机器学习的方式,不断优化人群的匹配。
在这个案例中,优化后牛肉线的广告下单转化对比历史同类投放增加了43%,高消费人群的转化更比历史同类投放增加52%。
第二类:衡量广告对品牌资产的影响
如同前面所讲的,目前,衡量广告对人群的影响非常困难,品牌很难摸清楚自己在消费者端到底拥有多少实打实的品牌资产。但对品牌广告主而言,能够量化品牌资产,是最能证明广告起到效果的方法。
难,在于人们的心迹无法直接敞开变成数据,进而被获取、被统计、被归因。
但行业还是能给出相对不错的解决方法。
如果一个消费者原本对某个品牌完全没有认知,通过广告投放,他发现了这个品牌,并且对这个品牌感兴趣,那么他很可能会产生一些探索这个品牌的行为。
这些行为,广告主基本上无法探知,但是媒体在海量的人群基础上,还是能够发现投放广告前后,人群行为变化的差异的。
作为媒体端提供的工具,RACE模型是能够做到这一点的典型工具。消费者对于品牌的认知情况,可以用一系列行为去定义。例如,人群与品牌广告的互动,可能意味着对这个产品有不错的兴趣,而进入这个品牌的小程序,则可能意味着更深的兴趣和偏好。
那些目标人群中从未搜索过这个品牌的人群,在广告投放之后有30%的人发生了搜索行为,这行为本身如同一个标志物,表明人群心智发生了“破冰性”的改变,成为品牌资产中的一环。
例如在某3C笔记本品牌的一系列广告投放中,基于RACE模型能够展示出品牌资产的流转情况。广告主选择了兼顾“品效”的营销目标,拟定了要达成更多R3、R4人群资产的投放策略,并在实际投放中,通过针对深层触动且具有转化潜力的R3人群,以及产生转化的R4人群作为正样本,浅层与深层双目标联合优化建模。
通过下图右侧的实际投放效果可以看到,对比模型优化前后,R1到R3的转化率提高了460%、R1到R4的转化率提高了63%,两项提升最为巨大的指标都与广告主诉求吻合。印证了RACE模型能根据品牌的营销目标,进而针对性进行建模为投放提效,帮助广告主实现“指哪打哪”的能力。
我们也可以利用这个模型中人群的迁移情况来衡量广告投放campaign的效果。
同样的预算,我的广告投放后,从R1到R4的人群迁移比例是5%,而你的广告迁移比例是10%,那或许说明你的广告投放比我的更成功。
这些数值,都反映了一个企业的品牌资产的跃升(变迁)情况。
第三类:衡量品牌在消费者心智中的整体提升
广告主也期待自己投放广告之后,能够在一定程度上“压倒”同类品牌。一个广告投放出去之后,若没有同类品牌的消费者“转投自己门下”,无论如何都不够成功。
广告主希望看到的人群迁移,不仅仅只是从曝光触达到浅层互动到深层触动这样的迁移,从行业层面看,广告主也希望看到其它同类品牌的人群迁移到自己的阵营中来。这体现出品牌在消费者心智中的重要性的不断提升。
这些数据目前只能靠调研或者大型媒体平台提供。过去的衡量方式主要是问卷调研或者舆情调研,但往往会受到样本量级或主观偏差影响,且比较难追踪当下复杂且加速动态演变的消费者心智。大型媒体平台提供的工具,比如RACE模型,可以提供相关数据,其背后的原理,仍然是基于人群的行为。
某个品牌手机发布旗舰高端机,广告效果的衡量很适合用品牌(产品)在行业中品牌力的提升来衡量。
例如基于复盘上波投放,发现“闪屏合约”及“信息流合约”的心智扭转效果更优,故在下波投放中基于转化难转化人群的营销目标,针对性优化资源组合进行投放。而在下波投放后利用RACE模型分析,购机人群中有20%来自于另一个原本使用某高端品牌手机的人群,而其中又有接近一半人持有该高端品牌手机的2代机型。广告深度触动的消费者中有三分之一,原本是另一个同类品牌的偏好群体。
这些数据给我们提供了衡量广告效果的参考维度。
坦白说,品牌一定是希望能用更真实、更直接的维度来衡量广告效果,比如具有识别性的消费者独占互动行为——实际对本品和其它同类品牌的广告点击、内容浏览搜索等。当广告投放结束之后,如果品牌主可以清晰地看到这些数据的变化,那么广告投放效果的衡量就更具有说服力。
第四类:对品牌和效果的综合提升
这一类效果的衡量,对利用多种广告形式组合投放的广告主很重要。
如果同时追求品牌和效果,那么往往会同时投放合约广告(主要对品牌的帮助)和竞价广告(主要对效果的帮助)。同样,更多时候还会有多种类型的合约广告的相互结合。问题是,投放什么样的组合(portfolio)会能够实现最好的效果呢。
所谓投放组合,是在既定预算或既定曝光次数下,品牌合约广告与竞价广告的预算(或曝光)比例,以及投放的曝光频次及投放的节奏(pacing,你是一次性花完所有钱,还是细水长流),该定成何种策略。
广告主不可能穷尽所有投放组合的可能性,此时,需要工具“提前”(基于该品牌投放的历史和行业投放的情况)告知广告主在什么样的情况下能够达到最好的效果。
好的效果如何实现?RACE模型从频次、资源两步入手进行增益价值优化。从下图中的案例中可以看到,第一步:针对不同的偏好人群,找到他们的最优触达频次,基于该品牌历史投放数据的衡量分析结果,得出结论:从宏观上看,本品偏好人群7.1次曝光后基本上转化率达到拐点,而同类品牌人群在16.7次曝光后才能达到拐点。因此明确针对不同偏好人群的的触达频次;第二步:基于不同人群的定制频次及本轮投放目标(曝光触达/转化/心智扭转/ROI),匹配具有不同价值侧重的资源组合,从而实现效果最大化。
除了RACE模型能够实现的四类科学归因方式,衡量广告效果,尤其是品牌广告的效果还有一些方式。这些方式包括:
-
捕捉并研究消费者在数字世界中的舆论;
-
投放触达人群的demo(demographics,即社会属性)与DMP中目标人群的demo之间的差异;
-
利用后链路的流量行为数据(engagement),判断流量的价值;
-
将后链路的流量行为数据及其ROI进行维度交叉,构建Engagement-ROI模型进行分析;
如果说前面四大类效果的分析,需要RACE模型这类的工具实现,那么上面这四类分析方法,也分别需要各类工具实现,例如,捕捉舆情,需要舆情工具;与标准人群的demo做对照,需要有DMP;后链路Engagement以及Engagement-ROI模型分析,则需要用户行为分析工具或者CDP;转化归因和归因模型,也需要专门的归因工具或具有相关功能的CDP。
如同我们前面所说的,对于广告投放效果的衡量,并没有一个放之四海而皆准的通用指标,所应用的工具也各不相同。一个趋势是,媒体端提供的中立工具(例如RACE模型这类广告主可以自助操作的工具),为广告效果的衡量和分析提供了另一个角度的方法,再加上广告主如能合理利用上述的所有工具,那么对于投放效果的衡量,基本上能够做到客观与全面。
不过,一个建议是,应用RACE模型这样的工具,要比其他自己采购或自建的工具使用难度低,对数据专业的要求也相应低一些。如果企业无预算或能力做上面所列举的这四类其他的衡量方式,那么,直接用媒体平台提供的工具,或许是一个更好的选择,即,在没有额外代价的基础上,仍然能够衡量和比较广告投放的效果,并至少能够获得相当全面的广告投放优化方面的洞察和建议。