编者按:本文来自壹娱观察(ID:yiyuguancha),文:武剑。36氪经授权转载。
刚入行时,有个朋友告诉我,“只要找出一次购买3张票的用户,然后给一轮消息推送,就能覆盖到那些有孩子的家庭。” 当时我听完觉得还蛮有道理的。不过,如果现在还有人这么说,我会轻声地告诉他:“大陆地区1.2米以下儿童不用买票。”
这两年来,大数据在电影行业很流行,电影行业的很多人也在忙不迭地沾大数据的光,于是我们看到了很多公关数据图都称作大数据图,很多复盘报告都叫大数据报告,很多公司都叫做电影大数据公司。
对于商业电影的从业者以及片方来说,如果能提前知道目标用户是谁、在哪、观影偏好如何,就可以在前期调整影片剪辑,做宣传物料知道哪些形式抓眼球,铺设物料知道哪些渠道有效,让发行兄弟谈排片的时候可以抓重点地区的重点影院,影院也知道要不要推出个什么套餐计划。这些事情说起来容易,但是真的要做的时候,我们应该使用哪些数据,如何使用这些数据?
从数据中看出来一锤定音的结论当然最好,但事实是大部分时间数据结论都是在验证一拍脑袋想出来的方案,长此以往,一些数据研究人员甚至对自己都产生了怀疑。
为此,我们需要首先达成一个共识:
数据分析人员当前理应先尊重业界中的“老发行”、“老宣传”、“老影管”多年积累的专家经验甚至是第六感,数据的基本目标是起到量化细化、落地执行、核验猜想、实时反馈的作用,但也应该始终保持一颗怀疑一切的心,有确凿的证据与更好的方案,那么挑战一下权威与经验主义,也未尝不可。
专栏第一篇,我们谈谈电影用户画像,主要面向三类人群:
宣传、营销、发行、影院、衍生品的一线人员
需要对外展示数据图、成绩图的数据公关人员
电影用户数据的研究者
先扔出一个结论:超级大片不用做用户画像,而中小体量片或是风格明显的类型片才需要做精细的用户画像。
当达到《美人鱼》、《捉妖记》、《战狼2》这种量级的国产片,或是《速度与激情8》、《变形金刚5》这样的好莱坞大片,他们可以带动的是数千万甚至是过亿人次的、杂糅了各种特质的电影用户,如此多数量的电影用户的标签掺和在一起,使得这样影片的群体失去了特点,也使得结论数据变得不好解释。当然,更重要的是,票房如此的影片也不太需要数据指导了。
而能在首日去看《冈仁波齐》的用户会具有某些共同的特点,比如喜欢宗教题材、喜欢张扬导演、或是喜欢混迹于电影论坛搜罗一些口碑佳片,他们也许人数很少,但他们是KOL,是意见领袖,是各大评分网站高分的首波奠基者。(点此查看:《冈仁波齐》的成功:站在“朝阳区三十万仁波切”的肩膀上)
对于影院来说,知道自己的用户画像也同样重要,但对于一线城市核心商业区的电影院来说,用户既有本地人也有游客,不仅流量大,每周用户画像变化极高且规律难以捉摸;大学周边的影院可以在非假期的白天时间多排学生群体喜欢的片子;而覆盖生活区的影院则可以测算父母带小孩光顾影院的频次来推出亲子票。所以说不仅中小影片需要关注用户画像,一些地理位置有特点的影院也要关注用户画像。
已上映影片的复盘报告可以用已有数据做,但大多数情况下,针对未上映影片,如何利用用户数据做前期报告?答案是:推演。用已知来推测相似的未知,这也是行业人目前都会做的事情。
如果是系列作品的,可以选择前作数据,但是如果是《雷神3》这种系列片,距离《雷神2》上映已有4年之久,当时的用户数据不一定代表现在市场情况了,那么找《奇异博士》是可以接受的。非系列作品则根据题材、导演、演员、票房体量来选相似影片,例如《羞羞的铁拳》可以找《夏洛特烦恼》,但是如果没有特别相近的影片,就需要找团队里观影量很高的同事来进行分析判断与推荐(这些同志是宝贝,请善待和培养)。
有时候我们会看到这样的“用户画像”——
王小锤:大三学生,单身,喜欢玩游戏且是二次元达人,常常混迹于B站。
上面这句话实际上不是用户画像,而叫典型用户角色,一般是确定产品或作品调性时的一个参考资料。
用户画像应该是某一目标人群的多维度描述。
每个制作方案的人员,都希望给领导一个丰富同时又新颖的角度,恨不得堆砌上所有能想到、能找到的数据,这样既体现工作量又能显得全面。但是能用且好用才是做用户画像的目的,也是笔者写这篇文章的初衷。
当大家在一起开头脑风暴会的时候,会设想许多有意思的宣传营销方式,比如有孩子的标签可以用来推送动画片,经常买两张票的用户更适合爱情片,但由于不熟悉用户数据维度或缺乏数据来源,使得很多想法无法实施或是实施后无法佐证。
用户数据哪里有?只有购票平台(猫眼、淘票票、较大院线的购票App等)有大量历史沉淀的、切切实实购票的、能精确到单体的、不断更新的用户数据。
笔者从壹娱观察此前的报道中了解到,今年黑马电影《一条狗的使命》发行(点此查看:电影发行未来的核心竞争力是什么?)时,阿里影业将淘宝上购买过宠物用品的用户进行了触达,虽然实际触达人数、触达成本以及最终转化率等未能得知,但该思路是接地气的,符合直接利用用户数据进行精准营销的理念。
如果片方或是发行营销方没有和票务平台合作,没有机会接触这些“热热乎乎”的用户原始数据,研究人员还可以掏出手机截屏票房分析App(如猫眼专业版)上的基本用户画像数据。
猫眼专业版APP基本用户画像数据,(以《寻梦环游记》为例)
如果以上成品数据结果还不能满足需求,很多人会求助于视频和搜索平台用户数据,而这些数据是网票时代未兴起前的第一营销风向标。比如优酷、爱奇艺、腾讯上某电影宣传片的观看画像,百度、微信、头条、微博、QQ等某关键词兴趣用户的画像。
不过,同一部影片在不同视频或搜索平台上的画像存在较大差异,这对于研究人员会造成一定的困扰,这与各平台核心用户的差异、用户所填写信息的真实程度、展示样本的数量多少等情况相关。
虽然是在大数据时代,一些发行营销或是影视数据公司仍会使用传统的小数据研究办法,比如问卷调查、试映会,询问被调查者是否听说、是否会去观看来判定哪类人群感兴趣,这也是一种以样本推全体的科学方法,样本如何选择以及效果评估已超出本报告内容,不再赘述。
目前大家最常见的用户画像是长这个样子的:
为了避免误伤,笔者没有用任何机构的成品图或是App截图。
让我们来看一看上面这样朴素的用户画像能得出什么结论。
1.女性用户占比高。
2.25-29岁的占比最高。
然后呢?这个结论让决策者看了会有一种“原来如此”的感觉么,只需要问四个问题就能让ppt小哥哑口无言。
1.哪个性别哪个年龄人士占比最高?(维度交叉分析)
2.以上人群是国内的主力消费人群么?(本底数据对比)
3.各类人群对电影的认可度如何?(补充口碑数据)
4.哪个人群最先去看,口碑好了之后又带动了哪个人群?(加入时间轴)
朋友们,在做了几十个大同小异的文案之后,会不会有那一刻的自我怀疑,究竟数据应该是什么样呈现的,又如何能指导决策?好,现在进入本文最干货的部分。
方案1 增加本底数据对比
什么是本底数据,本底数据有什么用?你心中认为国内男女观众比例是五五开,当你发现某个影片女性占比58%,就很快得出这个电影很受女性喜欢的结论。但是如果在女性人口占比高达54%的国家拉脱维亚,这个结论就显得不那么有说服力了,所以本底数据的作用就是给现有数据一个参照物。
再拿城市占比来说,很多时候,我们看到诸如上图的某个影片票仓分布,发现二线城市占比达42%,就说二线城市是该片的主力城市,其实二线城市数量和影院数本来就多,观众消费力本来就好,本来票房占比都是40%左右,一二三线及其余城市的票房占比基本都是按照20%:40%:20%:20%来分配,所以上图这组在小幅波动范围内的数据其实并不能得出什么有效结论。
而正确的示范则是在分析数据前,引入本底数据进行对比,例如用该影片上映周期内的大盘票仓分布、上映前三个月或一年的大盘票仓分布、甚至可以用同期竞争对手或相似影片的票仓分布进行对比。这样的范围更显著,更能得出结论。
方案2 交叉分析让真相见底
当有多个维度时,比如年龄,性别,职业等,可以用交叉分析法来细致研究各类人群。如下图所示
我们可以清楚地看到哪个性别的哪个年龄段是观影主力,主力人群的口碑维护十分重要。如果发现某个非主力人群评分很高,也可以针对这类人群进行宣传引导。当然判断是否是主力人群,除了跟本片的其他人群对比,还要跟其他本底数据进行对比。
方案3 加个时间轴,才知道数据到底是如何变化的(划重点!时间轴!)
不论是普通用户还是电影从业者都应该能感觉到,某个影片的零点场受众、首周末受众以及后续长线的受众的观影习惯和爱好程度都有所差异,所以只用简单的一个静态图已经不能说明情况,比如《战狼2》最早一批观众应该是男性较多,等口碑起来后女性观众入场,而最终呈现总体上是男女比例相对持平,这样的结果显然会误导研究人员,让他们认为同类型的战争影片会是男女比例持平的,而不需要在早期针对男性做什么特别的营销。
笔者画了个简单的示意图,不同颜色代表影片放映的不同阶段,不同时间段会有不一样的人群与用户画像,同时也就对应着不一样的宣发策略。然后是次周末观众,因为次周末上映了大量新片,这些观众依然会选择看上一周的老片,除了实在没有在第一时间去看的以及二刷的观众外,大多数是希望通过猫眼、豆瓣等评分来判断要不要去看。所以当影片质量不行或是口碑爆棚的时候,次周末的降幅或是涨幅就会很大。
最后是长尾人群,笔者给这部分人群起名为“不必营销人群”,对于这样的观众来说,早期的线上线下营销可能触达不到他们,甚至被他们完全忽视,好影评和高评分也不足以让他们早早进电影院,得辅以他们社交网络中亲朋好友的一遍遍“安利”。所以大家看到那些延期的电影,大都是这些“广告都打动不了的顽固份子”在陆续进场贡献着票房。
当然以上这些人群会有一定重合,并不是根据日期“刀砍斧剁”一样地整齐分布,他们之间会相互身份转化,比如《魔兽》的死忠粉对于《疯狂动物城》来说可能就是长尾人群,具体案例还是需要具体分析,如果想把一个影片的用户报告做深做绝,可以用以上这个方案去研究人群的动态变化,当然这么细致的用户数据只有通过猫眼淘票票等购票平台合作来获取(并不是广告)。
方案4 从实际用户角度多思考一步
有时候抛开复杂的算法,我们站在普通用户的角度,就会发现一些问题。
比如:所有购票平台只有购票观众的性别,而没有同行者的性别,那么即便一个影片有百分之60%的男性,很有可能因为情侣观影都是男性买单,其实看片动力源自于同性的女性。那么可能就需要一个校准策略,比如将部分两张票的订单进行分类处理并重新汇总。
然后回到我们开头的那个问题:看动画片的家庭,是否要买三张票?
此前我们会认为只有买3张票及以上的用户才是所谓的全家欢,但对于低龄动画片,一般孩子年龄较小,普通场次(特殊场次是IMAX,4DX等需要发放3D眼镜或是有特殊座椅的,这些大多需要全票购买)如果不满1.2-1.3m(根据地区影城而有所不同)则无需购票,而即便超过限定身高,被门口检票大姐姐拦住,也可以去柜台补半价票,目前各购票平台没有半价票这个选项的。即便我们拿到了一份数据说某场动画片都是28-35岁的女性只购了一张票,但仍然可能是带孩子去的,而这同样是玩具衍生品和小吃套餐的目标用户。
因此利用观看低幼动画片的订单结合购买者年龄来判断是否有孩子的,要远比用购买三张票的用户来判断的范围大且稳妥一些。
最后,笔者要强调一点,上述属于研究性的用户分析,而实用性则要靠购票平台的数据分析人员通过订单和行为数据结合来给用户打标签,再根据影片情况挑选出具有某种标签的用户群进行营销触达。
目前整个电影行业的宣发营销人员面对的仍是一个不太透明的市场,因为大量购票用户数据集中于某几个平台上,而即便用权威的专资办数据,查到了某部影片在某个地区票房产出的前十名影院,这也不一定是观众自然选择的结果,对于一些非正常性的数据,我们要有所甄别。
可以手头没有数据,但是心中要有想法,希望读者朋友对外部提供的各类数据(哪怕是一些权威机构的报告)也保持一定质疑性。因为篇幅原因,意犹未尽的朋友请加笔者难追的微信(nanzhuino1)进行问题探讨和咨询合作。