编者按:本文来自微信公众号“亲爱的数据”(ID:deardata),作者:谭婧,36氪经授权发布。
编辑柴犬,对此文亦有贡献
《少年的你》斩获多项香港金像奖,如果把周冬雨和易烊千玺都换掉,结局还会如此嘛?(千纸鹤,请息怒)
《如懿传》闹出“44岁周迅强行少女”的热点,除了周迅,还有没有更好的选择?
这些直击灵魂的拷问,让选角导演
居(qiang)功(xing)至(bei)伟(guo)。
几十年来,电影成就角色的传奇还在风中飘荡。成千上万的试镜人员,选角导演为电影角色找到气质最合适的演员,以至于给观众留下了“某演员就是为某角色而生”的印象。
甚至,综艺节目《明日之子》总监制马昊都说过,“选角的体系不是因为综艺刚需才去做,而是一年四季都持续进行”。
选角的重要性,无需多言。
美国洛杉矶的科技初创公司Cinelytic公司为影视投资人而准备,它利用强大的机器学习算法来发掘和寻找电影的“独门配方”。
正巧,华纳兄弟公司和索尼影业公司都是Cinelytic公司的客户。在强大的制片公司的配合下,Cinelytic公司研发团队开发了一个演员分析平台。
用人工智能来回答:《生产卖座商业大片的秘密?选角篇》
换句话说,好莱坞“挑选演员”的独门秘方里加入了人工智能技术,计算明星历史上的“票房影响力”,推测、预测演员“将会在新角色上的表现”。
演员与角色的魅力是不可思议的组合,相互成就。一个成功的角色会让人念念不忘。而这种魅力的“配方”也能被人工智能技术分析。
演员是电影的变量,类型、情节、高潮、华彩段落、对白都是,以前100%由人来决定,是人对电影的理解、经验,以及才华。
周星驰监制的电影,更可能让影片成为“票房保证”。
人工智能暗想:在“星女郎”之后,我也要有自己的女郎了。
电影是百年艺术,这期间科技一直伴随电影一路走来。
我们为什么不找新方法,换新角度,去“理解”艺术?
英雄所见略同,影业大佬华纳兄弟公司和索尼影业公司均这么认为:
人工智能软件并没有让“选角导演”下岗,而是为理解“不同元素如何对商业表现产生巨大影响”提供了一个决策框架。
有了人工智能,兴许“选角黑幕”也可以有所收敛。
这种类似我们所说的“潜规则”,在好莱坞则被称为“试镜沙发”(Casting couch),“受害者”通常都是当年渴望成名的年轻演员。
全球排名第一的声誉管理公司Ingenious Group董事Scarso对此表示赞同。人工智能指导电影投资,作为补充工具效果最好(是居家旅游、提神醒脑必备良药)。
预测股票涨跌的量化交易公司已经赚得盆满钵满,预测电影为什么不能日进斗金?
“看片量”决定电影爱好者的江湖地位,想混这个圈子人工智能也一样,要看足够的“原料”(数据)。
Cinelytic公司将媒体元数据分类,庞大的数据库(包含来自800万条内容的数据)融合了数据科学家和电影评论家的思路,“发明”各种从没想过的方法分析电影。
(豆瓣电影小组投来鄙视的目光。)
人工智能看懂电影、分析电影已经不是什么难题:
从文本、语音、视频的色彩、质感中分析观影情感(愤怒,哀伤)。
从冗长的电影中找到“人脸”(人脸查找+人脸比对技术)或者干脆替换“脸”(deepfake技术)。
从演员表情、行为中读“懂”内容(表情识别技术、行为识别技术)。
产品发布会上广告口播狂轰乱炸,观众昏昏欲睡,播放一段电影,是叫醒观众,避免尴尬的小技巧。这个信息的来源是《100个产品发布会叫醒观众的小技巧》(嘿嘿)。
科技公司早已瞄准了电影市场。
IBM 公司和20世纪福克斯公司创建了有史以来第一个由人工智能生成的电影预告片——科幻惊悚片《摩根》(Morgan)。
事到如今,人工智能似乎早已不满足于之前的功劳。
比利时的ScriptBook公司成立于2015年,声称其算法可以仅通过分析脚本来预测电影的成败。
成立于同年的以色列初创公司Vault向客户保证,它可以通过跟踪、追踪预告片在网上的接收情况,来预测哪些人群会观看他们的电影。
另一家名为Pilot的公司提供了类似的分析,承诺可以在电影发行前18个月以“无与伦比的准确性”预测票房收入。
美剧《纸牌屋》,网飞公司的成功之处就是将人工智能作为策略的“参谋长”。
尽管保守的电影行业老总可能会不愿意承认“数据驱动电影发展”,但数字流媒体公司有先天优势,他们冲击了传统,还有可能“后来者居上”。
电影特有的艺术魅力和形象感染力,决定了电影具有为数众多的观众和巨大的社会覆盖面。
几十年来,深入了解观影群体一直是好莱坞营销团队的活儿。洞察来自焦点小组,问卷调查和访谈总结调查。
现在,这些研究人员决定利用谷歌公司的产品(深度学习框架与机器学习算法)分析制片厂电影预告片中的相似之处,使制片人可以预测其最具商业可行性的观众的构成。
不要以为月亮只有好莱坞的圆。
达观数据文本应用数据项目经理苏格兰折耳喵(笔名)告诉《亲爱的数据》,人工智能在读懂“人民群众”的呼声。
“不同类型的电影,比如科幻、喜剧、体育电影等,预设情节的主配角所需的演员风格迥异,比如《鬼吹灯》改编的影视版本,有三个不同风格的雪莉杨,依次由舒淇的《寻龙诀》、陈乔恩的《精绝古城》、张雨绮的《龙岭迷窟》。”他谈道。
有观点认为,舒淇饰演的人物,个性是《鬼吹灯》版的劳拉,动作洒脱,但缺了点冷静大方。陈乔恩版则神形到位,但是动作不够洒脱。
如果提前用人工智能来选角,规避角色选择的失误,可以用到的技术有哪些?
他的答案是:“大数据技术+NLP语义分析技术。(NLP,自然语言处理技术)”
圈定了100个演员,但到底谁来演这角色还拿不准时,可以从互联网上采集媒体的报道和网民关于预选角色的意见与评论,再用NLP技术对采集到的数据进行降噪处理(得到较为“干净”的PGC和UGC数据)。
公共媒体和个体网民的评价,反映了“大多数人”对于演员的印象和评价,可以得到相对客观的明星调性综合性评价。(像不像小学时候,每学期老师写的学期操行评语。)
其中,较为关键的一步是提取跟这些明星相关的评价/个性标签(通过NLP技术),再以数据降维,将明星及其对应的标签信息融合到二维平面,从而得到各个明星的调性标签。
最后,比较这些调性标签和编剧的角色人设,如果完全吻合最好,如不吻合,选尽可能接近的。以下是挖掘结果的简单示意图,以最简单的情况举例:
三个女演员(雪莉杨扮演者)和十个不到的调性标签,活泼、干练、博学、沉稳等。以她们所在的点为圆心、一定的半径画圆,可以锚定明星的调性标签。
还有一个思路,首先分析预选明星的社交网络(微博、微信、Facebook、Twitter等),通过语义分析从中提取能反映其深层次情感特征的语义标签。
然后进行聚类分析,得到其复合的情感动机构成,将其占比最高的若干情感动机标签与角色的预设调性进行对比,圈定雪莉杨的最佳人选。
视线回到当年的《如懿传》,一部戏点落在女主角身上的大女主戏。
“女演员中演技口碑较高(超过65%)的艺人被筛选出来,既有二十几岁的周冬雨、杨紫等,也有35-50岁的孙俪等。”
“如懿的关键词包括强大、坚守、倔强等。女演员的个性热词与如懿的角色标签进行匹配,圆环的大小代表明星个性标签与角色如懿的匹配度,圆环越大,代表词频融合度越高。”
“周冬雨的匹配度很高,但故事集中在如懿35岁到50岁之间,实际的做法还是从右半边35-50岁的演员中选。”
如懿的关键词包括强大、坚守、倔强等。
艾漫数据是领先的娱乐大数据服务商,其工作人员在《商业周刊中文版©》的采访中坦言。
艾漫数据也颇具技术实力,公司董事朱小燕是清华大学计算机系教授,智能技术与系统国家重点实验室主任。
至今为止,人工智能并未100%预言正确。公平地说,人类也没有。黑马电影,出没不定,那为何不让人工智能和人类一起预测?
类似的观点,也来自于全球领先的信息分析公司爱思唯尔(Elsevier)高级数据科学家,沈澄博士。
并且,他认为,人工智能与电影行业的缘分似乎更缠绵。
他告诉《亲爱的数据》:
“电影是一种投资,自然要求回报高,票房好。如果有机会发掘新星,演员成本投入会降低,预测‘演员的特质有哪些’这类问题。类似电影《百万金臂》从近四万人中发掘了两位棒球投球手,这样的体育苗子的选拔。即演员符合哪些微妙的因素,能增加票房。”
也不排除一些导演稳定的选角习惯。比如知乎问题:“贾樟柯为什么那么爱用他媳妇儿赵涛演他的片子? ”
除了选角,人工智能,请快点来回答:
“怎么样让商业片电影知名度高,口碑好?”
在线等,挺急的。
他谈道:“在人工智能技术出现之前,在巨大的不确定性中做选择,都是靠人的经验,人为的把握。现在的话,比如说,电影上映时间的挑选、电影造势环境的营造,电影宣发的投入,线上线下发行平台遴选……
这些工作里有大量的数据分析、社交网络分析技术做支撑,以诱发电影口碑的裂变式传播。”
沈澄博士清清嗓子,继续谈道:
“还可以预测电影是否适合拍续集,因为拍砸了有风险。人工智能做预测,就是去把不确定性的范围缩小。
人工智能最大的特点就是,通过多因素历史经验的分析,以数据分析的方式,把原来比较大的不确定性,变成一个比较小的。或者,把原来比较小的成功概率变成比较大的成功概率。”
“鞍不离马背,甲不离将身” 说得是人工智能在各行各业用法颇多。
百年来,科技一直支持电影行业发展,如果让“人工智能”自己预测自己,大概率它会预测自己将是电影行业里一颗冉冉升起的“新星”。