见实|一览科技陈锡言: AIGC 新浪潮,不要怕,只是技术性调整
时下,AIGC技术正在以惊人的速度在各个行业中爆发,这种新型技术正在带来一场全新的行业变革大浪潮。越来越多的企业投入到新一轮的AI技术应用与研发当中,并取得了一定进展。预计未来它将对商业、岗位和职业造成更广泛和深刻的影响。
为了更好地了解未来AIGC时代的商业新机遇和岗位新趋势,并为行业提供更准确、更实用的建议,一览科技联合创始人&CTO陈锡言就《AIGC新浪潮,不要怕,只是技术性调整》进行主题分享。
陈锡言认为,大模型不同的发展路径也可能有不同的涌现结果,当参数达到一定规模的时候,涌现是怎么发生的,以及如果继续扩大参数规模是否能让效果越来越好,对人类来说还是一个待解决的问题。
他还表示,AI和AIGC的确会改变我们的生活和工作,这几乎是不可避免的,但不要怕,这只是一次技术升级,或者叫内容创作升级。作为内容从业者,我们应该对AIGC技术保持开放的态度,学会利用AIGC工具来提高工作效率,投资自己,提升自己,解决问题,提供价值。
以下为陈锡言分享内容全文:
大家好,我是一览科技联合创始人&CTO 陈锡言。
我名字的三个首字母分别是 “C”,“X”,“Y”,每个人都会喜欢和自己名字有关的东西,我也一样,后来我就真的成为了一名程序员。
在十几年的职业生涯中,我一直都在做着同一个行业,它就是网络视频。从网页端到客户端,从 PC 端到移动端,从影视剧到短视频,从横屏到竖屏,从 PGC 到 AIGC,从一小时到 15 秒,我亲身经历了这个行业的整个发展历史。
我此次的分享主题是《AIGC新浪潮:不要怕,只是技术性调整》
首先介绍一下AIGC的概念,AIGC是一个相对于PGC和UGC的概念,人工智能生产内容。
早期互联网以PGC为主,都是由专业机构生产和发布信息,例如Yahoo,搜狐等等,他们都是单向发布内容,普通用户只能单向接收内容,总内容量也比较少。
在互联网中期,出现了普通用户贡献内容。比如猫扑天涯,也有QQ微信,再到后来的公众号、微博、抖音。一方面是动态页面技术的发明,另一方面是制作工具的快速发展,让创作和发布成本越来越低,内容生产质量却越来越高。这个质量达到什么水平呢?一些专业电视工作者投身于短视频创作,而一些自媒体制作的短视频可以进入电视台播放,也就是说,优质的自媒体短视频已经达到了电视台的标准,所以有人把这叫做PUGC,也就是P和U之间的界限越来越不明显了。
那么现今的互联网,机器作为区别于P和U的第三方也可以大量生产信息和内容,这里面有两个含义。
一、机器听从人的命令生产内容。
二、机器直接生产内容。
未来会有越来越多的信息和内容是由人工智能生产的。
想象一下,会不会已经有一台计算机,它会自动在自媒体号上发表文章,然后根据阅读反馈数据,调整选题,调整内容,它能够自学习,然后让后面的发表数据表现更好,那它真的是一个从零开始的AI大V。
最近AI技术的发展,让我们重新看到了AIGC的可行性,肉眼可见的AI已经能做很多我们人类的工作了。AI是怎么突然变得这么强呢?
这还得说到大语言模型,ChatGPT让人类看到了AGI的可能性。AGI是通用人工智能的意思,表示机器可以完成各种不同类型的任务。比如ChatGPT并不是为法律工作特别训练的,但是它却可以非常好的完成法律任务。这就是AGI的表现。
大模型有四大: 数据量大,运算量大,参数规模大,花钱规模大。
GPT1和GPT2能力其实并不好,但是GPT3参数达到1750亿的时候,突然涌现出许多强大的能力,可以学习和模仿人类的思考过程。
OpenAI做出了一个典范,在OpenAI之前,没有一个人愿意相信原来大力花钱真的可以出奇迹。
大模型不是一个新技术,只不过没有人愿意为一个不确定的目标,投入如此之大。就像哥伦布发现新大陆,他告诉人们一直划一直划就会有收获,后面的人从此愿意为此投入。当然大模型也不是全是因为花钱,算力和数据量也恰好达到了一个临界点。不同的发展路径也可能有不同的涌现结果,当参数达到一定规模的时候,涌现是怎么发生的,以及如果继续扩大参数规模是否能让效果越来越好,对人类来说还是一个待解决的问题。
大模型的涌现主要带来以下方面的变化:
-
泛化能力:大模型能够在训练数据范围之外的情况下生成高质量的内容,这被称为“泛化能力”。这使得大模型能够应用于广泛的任务和领域。
-
语言生成能力:大模型能够生成流畅、准确、富有创造性的语言,这使得它们在自然语言处理、文本生成、机器翻译等领域有着广泛的应用。
-
交互性能力:大模型能够理解人类的自然语言输入,并产生符合语境的响应,这使得它们在聊天机器人、语音助手等领域有着广泛的应用。
感觉AI这么强,会很快抢走我们的工作,尤其是内容创作者对AIGC产生很多的担忧,下面我们看看AIGC对内容创作产业了哪些的影响
3.1. 取代部分文字工作者和设计师的工作
它将改变内容创作的工作方式,如果仅仅是简单可重复性的工作,那肯定是要被取缔的,具有创造力的做作AI取代不了。每位编辑或者设计师有自己的风格,这种风格的形成需要很长时间,这也是优势。但在处理复杂任务时,我们可能就需要具有各类不同优势的人组成的一个团队。但如果出现一种AI工具,它具有各种各样的风格和能力, 那么有了AI辅助,效率和风格的广度会大大提高。
3.2. 取缔大部分快消品内容生产
大部分互联网内容不是作为艺术品存在,甚至不是作为信息存在的,它们是一种快消品。制作快,生命周期短,在短暂的生命周期内争取最大的流量是他们生命的意义,爆款率极低,只能靠数量争取更多流量。所以这类业务KPI一般都会是成本控制,这类工作大概率会被AIGC所取缔。
3.3. 促进版权法升级
之前在图库中找到一张完美的图片并不容易,而且费用还是很贵的。现在AI工具可以直接从文本内容生成对应的图片。AI作品的版权还处于灰色地带,这是版权法最高级的部分。但这个状态不会太久,当未来越来越多的人使用时,这部分法律会得到完善。
3.4. 内容爆炸
我们并不想让他发生,但是一定是要发生了。互联网内容数量可能会至少是现在的10倍甚至更多,但总人数和总时间只有那么多。如何分辨内容是由AI生产还是由人类生产,以及如何选择更有价值的内容来填充有限的时间,将成为所有人的难题
AI正在影响我们的工作和生活,它很强大,但我们也要了解它具有哪些局限性。
4.1 内容风格有限
目前,AIGC最适合生成八股文等特定风格的内容,而对于更加创新和多样化的内容,AIGC的表现可能不尽如人意。AIGC模型只能基于已有的数据进行训练,而且数据的质量和数量对模型的性能有着决定性的影响。内容创作需要创意,优秀的艺术家需要形成自己的风格,这一点AI很难做到。
4.2 有限的知识
ChatGPT的知识只到2021年,目前还无法做到知识和信息实时更新。AIGC模型可能无法获取到一些人类知识领域的新发现和进展。AIGC模型虽然可以生成新的内容,但其缺乏真正的创造力和人性化,无法创造出从未出现过的完全新颖的概念或想法。
有人曾提出一个问题:如果500年前,就发明了ChatGPT,是不是人类永远不知道地球是围绕着太阳转的。这是一个值得令人深思的问题。
4.3 缺少验证和实施的能力
前几天有新闻说AutoGPT已经可以开公司了,但都是停留在纸面上的,真正实现还很遥远,现在的实际情况是,访问网站就很厉害了,除非雇人去办,否则怎么把真实公司注册下来呢?麦哲伦船队绕了地球一圈,才证明了地球是圆的,这并不能靠AI系统得到。科学发展需要大量的实验,AIGC跨越不了。
4.4 可信度问题
我让ChatGPT给我规划一条路线,他大概率会一本正经地胡说八道,AIGC模型的生成结果可能存在误差和不合理的情况,需要进行人工审核和验证,以确保其准确性和合理性。严格确定性内容不适合由AI生成。
4.5 数据偏差
AIGC模型需要大量的数据集进行训练,但这些数据可能存在偏差和隐私问题,如性别歧视、种族歧视等。因此,需要加强数据管理和隐私保护,建立透明度和问责制机制。根据公开资料,GPT3的训练集大部分来自英语,汉语预料可能不超过0.3%,所以很多价值观一定是偏西方的。这也是受训练数据集干扰比较大,且不容易被解决的问题。训练数据集需要非常长期的积累,可能真的不是直接砸一大笔钱就能解决的问题。
4.6 缺乏情感
内容是需要注入情感的,这是一个有争议的问题,AI能解决已知的逻辑,比如色彩是什么情绪,语音语调表示的情感,文字表示的情感。但更高级的内容是一种情绪的组合,这是AI无法感知到的,也缺少足够多的数据集,因为同一个内容,一万个人有一万个感受,所以在数据集中很难被标注出来。
4.7 难以控制
AIGC模型的运作方式是基于训练数据的自动化过程,因此很难对其生成的内容进行精确控制,可能会产生一些不适当的内容,引发社会或道德问题。比如,AI绘画虽然可以生成超越想象力的精美图片,但我认为仍然是一种“先开枪,再瞄准”的结果,因为我们脑海中的画面,转化成自然语言就是一种信息缺失,传递给AI理解又是一种信息缺失,可能最终AI画出了一幅很好看的图片,但早已经不是我们脑中的那幅画面了,过度依赖AIGC会让我们丢失很多脑中的景象。自然语言不是一种确定性的人机交互方式,而且为了让AI变得越来越强,它就必须产生新的随机、学习和反馈,目前大部分AI系统是不区分开发环境和生产环境的,生产环境的数据是开发环境最好的饲料。所以具有一定概率产生不合适内容,也是AI系统必要的工作之一。
4.8 AI无意识
如果几年前,两波程序员在群里吵起来,一定是因为讨论PHP是不是世界上最好的语言,现在两波程序员在群里吵起来,大概率是因为“AI是否具有意识”。这是一个哲学问题,咱们不做过多讨论。但人类为什么会如此关注“AI是否具有意识”,是因为人类认识世界的过程是将事物拟人,太阳公公,月亮姐姐,机器人一定要两条腿才叫机器人,四条腿就叫机器狗,人类更喜欢和自己相似的东西,所以人鱼一定要上半身是人,下半身是鱼;上半身是鱼,下半身是人就是怪物。将万事万物拟人化是一种哲学上的本质主义错误,因为“意识”对于”人工智能“来说是非必要的。
说了这么多AIGC不足的地方,但所有AI不足的地方都是人类的机会。
AIGC还在快速地发展,每周都有新产品发布,新论文发表,根本看不过来。那么AIGC在未来会有哪些可能性呢?
5.1 内容生产成本继续降低
AI现在在快速生产创意,以及技法上已经超过人类。未来AIGC生产内容时间会越来越快,成本会越来越低,这会导致新一轮的信息爆炸,这似乎是一个必然会发生的事情。
5.2 多模态模型的发展
当前的AIGC模型主要依赖于文本数据来生成内容,GPT4号称多模态但还一直未发布,文心一言的多模态其实也仅限于接口调用,我认为真正多模态应该是机器自主使用多模态的表达,由AIGC自己来结合多种类型的数据,例如图像、音频、视频等,生成多模态内容。
5.3 互动内容成为可能
很多年之前,我们就设想过互动内容,根据观众的反馈产生不同的下一内容,但是由于复杂度过高,只能制作有限的分支剧情,效果都不是很理想,AIGC可以有效解决这一点。我们不需要提前制作好所有分支剧情,可以在发生时再制作。举例来说,现在推荐系统是根据人的喜好来推荐已有内容,未来有可能实现AIGC根据人的喜好实时生产内容。
5.4 个人AI助理
AI会成为一个基础设施,所有人未来可能都要人手一个AI助理。未来可能只有两类公司,AI基础设施维护公司,和AI应用公司,而完全和AI无关的企业将会被淘汰。未来公司中可能只有两种岗位,一种是数据标注类岗位,另一种是使用AI工具工作的岗位,而完全和AI无关的岗位可能也会被逐渐淘汰。“通用人工智能成为可能”不是一句危言耸听的话。我们身边的小度小爱天猫精灵可能很快会变成Jarvis。无论设计师、编辑、工程师还是什么工作岗位,因为“个人AI助理”的出现,对效率和质量的要求会建立在一个新的标准上,就像几百年前工厂的出现一样,这个过程似乎也是不可逆的,我们只能接受。
5.5 AI对齐
AI对齐指的是确保人工智能系统的目标和行为与人类价值观一致,因为AI如果滥用其强大的计算和学习能力,造成人类无法控制的后果。比如说,我们给AI定一个改善地球自然环境的目标,AI最后得到的方法是减少人类数量,这就是比较可怕的结果。AI对齐的最基本目的是保障人类社会的利益和控制权。未来的研究可能会集中于开发更加可解释的AIGC模型,这将使人们更加理解模型是如何生成内容的,并且更加信任模型的结果。任何时候,AI对齐的追求是使得人工智能系统成为有益的工具,为人类创造价值,与人类和谐共处。
前面介绍了本次AI浪潮中AIGC的优势、问题和发展方向,作为互联网内容从业者,我们该如何应对这次浪潮呢?
首先,不要害怕。我们需要认识到AIGC只是一次技术性调整,而不是对传统内容创作产业的完全颠覆。AIGC系统可以快速帮助人类拓宽知识广度,但它并不会取代人类的智慧和创造力。这次AI浪潮是一次伟大的进步,但它不会让我们失去饭碗。相反,它需要我们自我反思,找到自己的核心竞争力。
其次,拥抱变化。学会利用AIGC工具,设计师和内容从业者可以考虑利用AIGC的优势来提高工作效率。例如,利用AIGC生成的文字和图像可以完成一些基础工作,从而节省时间和资源。这将允许他们更好地专注于更高级的工作,如创新思考和策划。
第三,投资自己。与此同时,设计师和内容从业者可以把注意力放在提高他们的技能和知识上。学习新的技术和工具,如AIGC和其他人工智能技术,可以帮助他们更好地适应未来的工作要求。此外,提高沟通和协作能力也非常重要,因为这些技能不可能被机器人取代。
第四,了解市场。了解市场和客户的需求是成功的关键,而AIGC可以提供有用的信息来提供帮助,AI不能帮你做决策。我曾经表达过一个观点“AIGC并不会带来爆款率提升”,未来不是拥有流量红利的时代,但爆款内容会一直稀缺。如何制造爆款内容取决于人对市场判断,以及后续一系列的运作。大数据监测只能算是蹭热点,不能称为创作爆款。
最后,我总结四种AI替代不了的能力提供给大家参考:
「创造力」「情感」 「解决问题」「提供价值」
AI和AIGC的确会改变我们的生活和工作,这几乎是不可避免的,但不要怕,这只是一次技术升级,或者叫内容创作升级。作为内容从业者,我们应该对AIGC技术保持开放的态度,学会利用AIGC工具来提高工作效率,投资自己,提升自己,解决问题,提供价值。
谢谢大家!