作者| 廖垠雪
编辑| 傅博
当我看到这个消息的时候,内心是崩溃的:AI可以剪视频了。这意味着也许一小部分电影从业者,包括我们在内的新闻视频工作者,未来可能更难找工作了。(掩面痛哭)
正如李开复最近在哥大毕业典礼上发表的演讲所提到的,未来十年也许真的是人工智能的时代。
但是,当许多人处于AI即将取代大部分简单重复工种的不安中,尚且还有一群人偷偷地吁了口气,比如艺术从业人员,因为那时我们并不认为AI可以在近期内胜任兼具创造性与艺术性的工作。
……直到我们看到斯坦福与Adobe的这项研究。
这个新的算法可以根据导演要求,对视频原始材料进行编辑,不论是papi酱那种精分风格的视频,还是经典的电影风格视频,它都可以在极短的时间内完成工作。
首先我们要跟大家简单科普一下视频剪辑师的工作流程。比如说我们要制作一个有情节的微电影,首先我们会根据写好的剧本进行拍摄,同一个场景和镜头一般要从不同的角度、机位拍上好几次,这样才能获取不同角度、不同景别的视频材料。
在后期剪辑的时候,则可以把同一场景的多个片段放在一起剪辑,这样就可以运用镜头语言表达不同的情绪、传递多样的信息,也避免观众因为镜头过于重复和单一而感到无聊。
但是,一般来说,这个工作比较琐碎,技术含量相对较低。而这个算法则可以为剪辑师节省许多时间,避免繁冗而无聊的工作。
首先,这个系统可以把同一场景的不同镜头进行有序排列,并将其与剧本进行对齐,也就是将人物的对话与剧本中的台词一一对应。
它也可以通过声音、面部和情感识别对镜头类型、演员的感情强度、画面构图等进行编码。由于导演对于一个场景可以拍摄多达10场镜头,光对应剧本这一个功能就可以节省数小时。
然而,这个系统的“精华”之处在于根据电影镜头语言的规则进行“惯用”编辑。
例如,许多故事都是从一个广角的“建立场景”镜头开始,这样观众就会对故事发生的地点具备基本的了解。有些时候,导演还会使用慢放或快进的方式,强调某个人物,强化情绪或保持镜头类型(如广角或特写镜头)一致。
《摔跤吧,爸爸》里面的人物特写镜头
根据导演或者故事本身的不同风格,导演运用这些镜头语言去达到最好的讲述故事的效果。而这个系统操作起来非常简单。
研究人员已经预设了许多镜头语言的设定,编辑们只需要把他们想要的镜头语言输入到系统中,这个系统就会自动将剧本与场景匹配。
在斯坦福研究团队制作的说明视频中,他们给出了一个具体的例子。比如,他们想要制作一个传统电影风格(在对话双方之间进行切换,叙述节奏不紧不慢等)的视频,编辑就会选择“用广角镜头开始”这个镜头语言来建立故事发生的场景,然后选用“避免跳跃性的剪辑“来适用于经典的电影风格,同时选择“强调某个角色”等电影语言。
这个系统在几秒之内迅速制作了一个极具喜剧电影风格、严格遵守剧本的电影片段。看完之后我的下巴都要掉地上了——这简直与人工剪辑无异啊!
然后,测试人员用同一个剧本和拍摄材料,选择了“跳跃性剪辑”等典型的youtube网红视频的镜头语言,于是另一个youtube风格的视频又在几秒钟被制作出来了。
整个过程中,最令人瞠目结舌的是,这个算法能够在2-3秒内根据特定要求生成一个71秒的视频,并且可以在几秒内生成另一个完全不同风格的视频。
研究团队非常残忍地请了一位具有25年编辑经验的剪辑师来完成相同的工作,这位剪辑师一动不动盯着电脑屏幕看了三个小时,才能完成从浏览所有视频材料到手动进行剪辑的所有过程——而且只剪辑出了一种风格的视频。
据他估计,如果要制作出另一个完全不同风格的视频,需要另外花上一个半小时。
更重要的是,它可以减少许多重复细碎的工作,并让编辑在短时间内看到基于不同风格的视频样品。这将使他们拥有更多的时间进行微调,并且在其它方面发挥他们的技能和艺术才能。
但是在目前,该系统仅用于对话类的视频剪辑,毕竟人脸和语言比较易于识别。而且它没有办法在某个演员说话的时候,自然地切到对手演员的画面从而表现其他人物的反应。
此外,它也无法判断表演的好坏和拍摄的质量。有时候不同场次的拍摄材料中会出现不一致(也包括观众们最喜欢看的穿帮),目前这个系统也没有办法识别这些错误,编辑、制片人和导演仍然需要亲自检查所有拍摄的视频。
未来,研究人员将会努力扩大它的使用场景,比如剪辑动作片,这也就需要研究人员输入更多针对动作片的镜头语言设定,
当然啦,从目前来看,这个AI也只够格做个编辑助手,在短时间内不会完全取代视频编辑师。那么看完此文有些焦灼的你该如何提升自己而不被AI取代呢?
我们觉得,保持你的创造力和独特性,努力打破常规,去深切地体会人性和美,也许就是我们战胜机器的重要砝码。