当业界还在激烈探讨创意总监们是否会失业时,快速迭代的机器生产力已经在悄然改变营销创意的生产关系,并裹挟着广告从业者们,从古典广告时代向数字营销时代一路狂奔。
来自巨量引擎的数据显示,平台上的创意素材,已经有近50%来自机器创作,此外还有22%是人通过智能化的创意工具生产出来的。也就是说,机器对创意的渗透率已经高达70%。而这个数字还在不断被刷新。
这一切都源于信息流广告的兴起,尤其是抖音开启的短视频信息流广告浪潮。瀑布流般的呈现形式,在带给用户极大丰富选择的同时,也展示了对创意素材超乎寻常的胃口。
数据显示:从2019年到2020年,全行业视频广告创意生命周期下降了50.63%,而同期有消耗的视频广告数量增长了4倍。
这也意味着,广告主们最需要的,不仅是一条耗时数月精心打磨出来的优秀创意,更是在1天内就能产出的1000条优秀创意。
如何才能规模化、高效的解决这个问题?
事实验证:规模化需求最好的解决途径还是技术。图文信息流的媒体巨擘们找到了程序化创意(Programmatic Creative)。这种以机器算法与大数据洞察为核心,对广告素材进行分解与动态组合,从而达到规模化生产的创意生产机制。
但当广告形态演化到短视频时代,新的解决方案会是什么?巨量引擎的技术团队的选择是:让机器直接生产创意。
很多人认为,创意这个事,是人类文明皇冠上的明珠,结合了心理学、美学、传播学等多个学科,代码真的能让机器代替人脑搞创意吗?
而创意技术团队用事实证明,技术让创意生产进入了一个新阶段:以人工为核心的经验创意,走上了以机器为核心的智能创意演变之路。
2018年年初,当时市面上几乎所有的智能创意解决方案都是针对图文广告的。当时头部平台巨量引擎的创意素材库里的物料,90%左右都是图文,只有10%左右是视频。而迫切希望在短视频平台上投放广告的广告主们,有视频创意生产能力只占少数。
面对问题,工程师们擅长的是把复杂的问题拆解成简单的问题。巨量引擎创意技术团队把视频创意需求问题拆解成了两层:生产层和效果层,最迫切的是生产层。
生产层面对的两个核心问题是:
1. 如何让不会生产视频的广告主能够生产视频?
2. 如何让视频创意的生产速度跟上流量的消耗速度?
工程师们的解决思路同样简单:不会剪视频,那就让技术一键剪出视频;生产速度跟不上流量消耗速度,那就借助算法模型和素材库,利用已有的视频,派生出更多的视频。
在这个思路指导下,2019年9月,巨量引擎首款能够自动生成创意视频的工具上线。
用户只需要上传任意尺寸的图片、视频、文字、音乐等素材,机器就能迅速对素材进行分解、遴选、裁剪、排序,2分钟即能生成12支结合了不同特效、不同转场风格、不同音乐,且能自动卡点、自动配音、自动匹配字幕的创意视频。用户从中挑1支满意的视频即可。
而同样的视频,要由人工剪辑的话,需要经过找音乐、标记卡点、遴选高光镜头、高光片段混剪、视频尺寸裁剪、编辑字幕、配音并校对时间、添加特效转场等8个繁琐的环节,即便是最熟练的剪辑师,也需要30分钟才能剪出1支。
这款产品就是引起行业极大反响的“微电影”。
“微电影”上线后,使用反馈雪花般飞来,追求极致的工程师们迅速进行产品改进。6个月后,经过15次迭代的微电影Pro版上线,在原微电影基础上,融合了视频编辑器、模板视频,可以满足从小白到高手的高频需求。
30分钟vs2分钟,15倍的效率提升背后,究竟是怎样的魔法?
巨量引擎创意技术团队称这项技术为“自动生成技术”。简单的说,就是由机器通过模型算法,利用现有的素材,直接生成不同创意的技术。目前该技术已经在创意生产上得到了广泛应用,比如能自动生成广告标题的妙笔、自动生成海报的图灵等产品等等。
让机器生产创意素材,尤其是视频素材,是个非常复杂的问题。
首先,机器得理解素材,其次,机器得理解剪辑,最后机器才能学会按人的思维剪出符合人类美学的视频。
理解素材,就是机器得学会用人的视角明白视频、图像、文本、音乐讲的是什么。
这涉及人工智能领域四大核心技术——自然语言处理、计算机视觉、语音识别合成以及机器学习,每一项技术里又包含很多项子技术。比如计算机视觉就涉及目标识别、图像分割、人脸检测、人脸识别、生成式对抗网络等技术,综合下来要实现机器生产素材,至少需要几十项AI前沿技术。
但这对巨量引擎创意技术团队而言,并不难。
毕竟,字节跳动在自然语言处理、计算机视觉、语音识别合成、机器学习等方面有着雄厚的技术积累,而且在今日头条、西瓜视频、抖音等十多款内容平台有着广泛地落地应用。
如何让这些技术在对稳定性要求更高的商业化场景的落地应用?
创意工程师与AI工程师们一起,进行了多模态内容开发,不断调教机器,让机器越来越准确地识别各种素材,并将其应用到各种商业化场景中。不断的学习中,机器越来越理解商业素材的特性。
机器理解了素材后,就需要学习剪辑,即对多组视频镜头进行切割后重新排列,从而形成新的叙事逻辑,其中的关键能力是“叙事”。
人类叙事能力,是儿童时期通过不断与父母沟通,观察和感受父母的语言、表情等反馈逐渐习得的。同理,机器的“叙事”能力养成也需要靠海量数据的反馈。
工程师们总结了大量人工视频的剪辑手法,并引入专业人士,为机器制定了基本剪辑规则。比如在时间布局上,他们告诉机器,第n秒后用户会产生视觉疲劳,因此需要一个动感的转场,第M秒最好用舒缓的镜头过渡方式。空间布局上,他们提供视觉最舒适的文字与图像在画幅中的分配方案,以及大致的色彩搭配等规则。
工程师们将这些规则系统化,结合数据洞察,并将其数据化、模型化,让机器建立剪辑逻辑,尝试将素材组合起来,并不断利用最新的视觉技术,提升机器剪辑能力。
例如将光感度各不相同的镜头进行混剪,机器一开始没有头绪,但引入了光学镜头视觉重心分析技术后,就可以通过分析不同镜头中的视觉重心,进行符合人类视觉习惯的排列,最终保证了用户观看到的画面是流畅的。
同时,一方面通过抖音等内容平台上的大量视频,建立优质视频的反馈数据库,一方面通过投放的商业视频,建立商业反馈数据库。
机器生成的素材,会不断通过反馈数据集进行训练,逐渐习得叙事逻辑。
当数据积累形成了一定规模。机器对商业化广告领域的好“叙事”该有的样子逐渐清晰起来。就如同儿童也意识到故事里突然出现狗会更精彩,在一则15秒的广告中,怎样的转折点最抓人眼球,哪些元素的运用会最大程度令观者注意力集中,机器开始有了自己的答案。
举例而言,在一则视频广告里,前三秒是一个美女拿着产品由远及近入画的视频,中间五秒是一段产品特色展示和使用方式的特写镜头展示,同时借助文案自动转换语音的功能配上解说词,最后两秒是促销动画贴纸引导用户点击跳转。
生产过程不再需要套用模版,也无需人工指导,整个叙事逻辑全部由机器自主决定。
剪出符合人类逻辑的视频,只是达到了创意工程师们的合格预期,但如何让机器剪出令人赏心悦目的视频呢?
这时就需要创意专家们介入了。于是,4A公司的顶尖创意人被邀请进来,并帮助工程师们建立起美学评价体系。
基于这些规则,机器会自动生成大量的候选集,而创意专家则会对初轮内容进行各个维度的人工评分。依据评分,机器对美好内容的认知越加清晰,进而学习模型得到一次又一次的优化。
“美”并非深不可测,通过解构分析,美可以被归纳出视觉、听觉、光感等多个维度下的普遍规律。但凡有规律的事物,理论上都可以被机器所学习。巨量引擎已逐渐构建起光学模型、美学模型、音乐模型等八个细分模型。
人类与机器共同努力,以一种匠人精神,细致入微的打磨广告内容的方方面面。最终,让自动化生产优质创意内容成为现实。
从不及格到及格相对容易,从良好到优秀的路则更困难。
既要遵循实用原则,真正理解营销人员的痛点,难点,实现广告投放的更高性价比,同时也不能抛弃人类对美好事物的终极向往,始终坚信“美”的正义。
在同一套评分体系里,微电影最初生成的视频只有30多分,但最新版生成的视频,已经能达到90分的高分,相当于一个普通创意设计师的水平。
创意数量的提升,只是基础,要真正满足广告主的需求,还需要看结果——是否能够影响用户?简单的说,是否能吸引用户点击广告?
答案很简单,就是利用推荐技术与数据分析,让用户看到更符合自己喜好的广告。
这个思路在内容消费领域的应用比较成功的是巨量引擎。那么,广告怎么满足个性化需求呢?
个性化创意的核心是如何把对的创意匹配给对的人。也就是说,机器首先需要借助数据洞察技术,充分理解目标用户的内容喜好与商业需求,知道TA们会喜欢什么样的创意形式,并据此派生出不同的能够满足不同用户个性需求的创意。
其次,机器需要借助各种算法,如质量排序模型、效果预估模型等,筛选出优质创意,对用户进行精准投放,并定时监控投放数据,根据用户反馈不断调优,停止数据不好的创意,启用新的创意,直到选出最优秀的创意。
这样,目标用户看到了更喜欢的创意,广告主收获了更好的投放效果。
巨量引擎的数据统计,相对于人工创意视频,采用了自动生成技术与个性化创意技术的创意视频,投放CVR平均提升了61%,CTR平均提升了25%。
如今,在巨量引擎平台,机器创意的影子无处不在,视频生成、海报生成、标题生成、模板视频、程序创意等等。
正如开篇所言,仅2020年,巨量引擎平台上,机器创意的渗透率就已经超过70%,未来呢?创意人会被机器彻底取代吗?
机器的确在颠覆创意行业,甚至在变革创意生产关系,但在巨量引擎自动生成技术的研发过程中,机器并不能颠覆人的创意,人的创造力依然是创意发展的核心动力。
马歇尔·麦克卢汉在《理解媒介》一书中曾断言:一切技术都是人的延伸,智能创意技术同样,建立数据模型、美学规则的是人,创意金字塔顶尖的作品,依然属于才华横溢的创意人。
机器创意打碎的只是创意的繁琐流程,解放的却是创意人最宝贵的创造力。人机联手,才是创意的星辰大海。