AI Art 实现作画自由?你需要知道这六大隐形门槛
最近,以“零门槛”“好上手”著称的AI Art在社交平台广泛引起关注,不少人热衷于将真实照片通过AI作画平台转成“漫画风”。在B站,以《杀死那个石家庄人,但是每句歌词都是AI作画》为代表的“歌曲+AI Art”的视频动辄几十万甚至上百万的播放量。但,AI Art真的已经强大到足以帮助非美术专业用户实现“作画自由”了吗?怀着这一疑虑,笔者试用了文心一格、6pen Art等AI作画产品,却发现“买家秀”和“卖家秀”还存在一定差距。
在两个国内较热门的AI作画平台上输入“江南水乡,撑着油纸伞的姑娘行走在雨巷”后,笔者期待得到的画作是这样的:
但,等待几分钟后,得到的AI作品是这样的。
即使这两幅作品并不能代表AI作画的真实水平,但至少说明当前AI Art尚存在一定的使用要求。所谓“器欲尽其能,必先得其法”,那么,AI Art的准入门槛有哪些呢?带着这样的疑惑,笔者进一步采访了相关专业人士的AI Art使用经验,他们尝试过的平台主要有Stable Diffusion、Novel AI和Disco Diffusion等。
1.编解码门槛
因语意误读而影响生成结果的现象多发生在国产的AI Art平台。这是因为,当前AI作画的核心模型CLIP模型只支持英文版,而国内尚未开发出能与CLIP模型的生成能力相媲美的模型,因此国内的AI Art平台在底层模型的选择上无非有两条路径:
一是使用自研的算法模型(如百度的文心·一格就是依托于百度自研的飞桨、文心跨模态大模型),但这类模型与国外的Stable Diffusion相比还有一定差距,且其训练成本往往极其高昂,动辄数百万的成本和技术壁垒在一定程度了上阻碍了国内算法模型的进步。
二是使用Stable Diffusion等国外开源模型。由于这类开源模型的基础语言是英语,因此需要将用户输入的中文通过映射表的匹配来转换成英文。这一转换过程并非中译英那么简单,会导致AI生成图像的随机性进一步增强,让AI作画的规则与逻辑变得更加难以捉摸。
此外,由于表达习惯等方面的差异,使用者表达和机器理解之间的也会存在一定的折扣。例如,小慈是一名媒体行业的内容创作者,他第一次与AI作画的近距离接触是源于AI Art平台“6pen”来公司做的一次交流推广会。会后小慈抱着好奇的心理尝试输入“汗血宝马图”,结果却得到了一辆汽车的写实图。该图像生成不准确就是由于,在AI现有的概念框架下,更倾向于将关键词拆解为“宝马”牌汽车、汗与血。
2.应用门槛
要想在Novel AI等国外的AI Art平台上生成一幅好的画作,需要对艺术风格、创作流派、美术甚至是所在平台的模型运算法则有一定的了解。为此,有人专门整理了Prompt(提示词)的入门工具书。以PromptBase代表的一些公司甚至靠专门兜售AI Art平台的“高质量”提示词而发家致富。
就详细规则而言,给定关键词的精确程度会影响AI作画的生成结果。如何穗创作的这幅“80年代好莱坞女星即视感”的作品,其中的关键词就包括1980s'。因此,普通人如果想创造出观感很棒的作品,需要先学习大佬整理的元素法典的关键词,在不断尝试的过程中掌握基本逻辑,再次基础上加入自己的独特构思。这是AI Art设置的第一道应用门槛。
其次,关键词的排列顺序和权重是AI Art的第二道应用门槛。排序越靠前,则该关键词对应的内容在画面中出现的权重越大。部分AI绘画平台需要同时设置正反两种关键词,反向关键词(如lowres, bad anatomy, bad hands等)会减少这类内容在画作中出现的比率。此外,需要通过特定的符号设置权重。以Novel AI为例,括号越多,表示括号内的词越重要。
3.配置门槛
除了“技术门槛”外,“配置”往往也是用户们逃不开的硬伤。这种配置方面的门槛又可以分为硬件配置门槛和软件配置门槛。
就硬件配置而言,本地版AI作画对电脑GPU的要求较高。以Novel AI为例,针对不同的电脑配置提供了不同的bat,有显存4GB、6GB、8GB之分,显存越高,出图越快、越清晰。当前,6G的显卡几乎已经是本地版AI作画的基础配置,RTX计算卡的运行效果最为理想,而AMD显卡、10系及以下老显卡的体验效果较差。这对于电脑配置有限的普通用户而言无疑是一种新的鸿沟——如同电脑刚普及时对没有电脑、网络的人群的数字鸿沟那样。
就软件配置而言,由于不同AI创作平台之间的壁垒还没有打通,因此有时需要与其他设计类软件配合来使用。比如,如果想提升画质,需要移步到其他专业性的AI修复画质的软件上进行操作。再比如,当前的AI作画平台上还难以进行特别专业化的后期操作,需要将图片下载、画质修复或增强后再转接到PS等软件进行后期完善。这要求使用者在软件配置上有较为完善的图片设计生态,才能生产出较高水平的画作。
4.技术门槛
在2022年7月的百度世界大会上,CEO李彦宏预测了AIGC将走过的三个发展阶段,分别是辅助人类进行内容生产“助手阶段”、人机共生的“协作阶段”和AIGC独立完成内容创作的“原创阶段”。目前AI作画尚处于第一阶段,因此尽管AI Art可以进行创意生成,但更多地还是扮演着辅助性工具的角色,需要人为对创作过程进行干预。广为诟病的“AI画手”就充分暴露了AI作画的短板——不少AI作品都需要人工后期修改润色,而这一环节恰恰也是最考验创作者技术水平的环节。
今年8月,AI作品《空间歌剧院》由于获得美国科罗拉多州博览会一项美术竞赛的一等奖而引起了不小争议,但这幅画作也经过了其“主人”将近80小时的后期修图。人工后期修图的需求在一定程度上还是将不懂美术创作的人群拒之门外。
相较于普通用户,专业人士在面对技术门槛时显得游刃有余。动画专业的何穗在利用Novel AI进行创作时,对于不满意的部分会导入inpaint反复修改,将不满意的地方抠掉而保留其他部分。何穗在对绘制人物肖像画的少女腰带和头饰比较吃力,因此她选择将自己创作的半成品画导入Novel AI,通过设定关键词让AI沿着她的创作思路继续补充,最后再把想要的腰带和头饰部分抠图到原作中,让自己与AI之间“取长补短”。不难发现,这种“AI+人脑”的创作方式对创作者的审美水平和绘画水平都有一定的要求。
5.时间门槛
在创作体验上,AI作画就像是一个“抽卡游戏”,输入同样的关键词很可能得到完全不同的创作效果,且有无穷无尽的可能性。这是由于,AI作画随机性是由随机种子来控制的,而随机种子的可能性达四十亿种之多。这也意味着AI作画水平并不稳定,因此要想得到一幅理想画作,可能需要不断进行尝试,要求使用者愿意付出足够的时间成本。对此,平面设计专业出生的小唯表示,只要AI生成的画作能达到自己心理预期的一半以上就已经非常满意了,而要想达到这个标准,她一般需要尝试数十张到几百张图片。
沿着这一思路,笔者在文心一格平台上重复输入多次相同文案(“江南水乡,撑着油纸伞的姑娘行走在雨巷”)后,得到了较为满意的水墨画。
“一般是R(普通卡)多,SSR(稀有卡)少,但只要抽的次数足够多,爆率调的精确,总会有光影好看、结构正确又精美的SSR出现”。何穗拿游戏“阴阳师”的抽卡游戏来形容AI作画的不确定性。
6.版权门槛
当前,AI生成的作品在版权上存在较大争议,不同平台对版权归属有着不同的规定,但却难以形成一致意见。如,Stable Diffusion表示“版权归公共所有”;Midjourney的付费用户与平台共同拥有画作版权;百度的文心一格声明“知识产权归平台所有,且在没有授权的情况下无法商用”;6pen则“不保留任何版权,生成的图片版权都归属生成者,可随意自用商用”
这种不一致的版权归属根源在于,当前并没有立法对AI作品的版权归属做出明确规定,也因而产生了种种乱象。从技术角度来考虑,这种侵权在开发前期几乎是不可避免的。因为AI Art能够进行画作输出的前提是有足够多的学习样本作为数据库,但由于数据库的样本量太大,根本无法征得数据库中每一幅作品的主人的同意。连开发算法的后台人员也表示“无法保证未经授权的画作一定不被学习”。
在采访过程中,笔者发现,版权方面的争议在一定程度上“劝退”了部分使用者。插画师小辉从今年6月起开始尝试AI绘图+人工精修的创作模式,但11月的一天,他偶然发现自己的作品在小红书上被“挂”了出来,原因是这幅被小辉打上“原创”标签的作品有AI作画的痕迹。对此,小辉觉得很委屈,因为那幅画从前期的关键词组织到后期的调色都是自己完成的,甚至还对作品进行了大范围的手工修改。至此之后,小辉就减少了AI Art平台的使用频率。
由此可见,尽管AI的智能作画机制已经较为成熟,但要想实现“人均艺术家”,还需要跨过多个隐形门槛。对于普通用户而言,需要根据自己的实际诉求来针对性地解决这些问题,以便AI更好地服务于画作创作的需要。同时,从宏观角度来看,如何与这些门槛“和解”,甚至突破这些门槛,事实上也是“人机共生”在内容创作层面不断探索的一种体现。
(本文中何穗、小慈与小辉均为化名)