AIGC爆火背后,都有哪些未来之星?
2022年是AIGC爆发元年。今年8月份,一位毫无美术基础的游戏设计师,利用AI绘画工具Midjourney生成的《太空歌剧院》画作,获得了专业艺术比赛评委的认可,也掀起了全球对于AIGC赛道的强烈关注。
这里还需要提到一家公司。今年10月份,一家成立不到2年的公司Stability.AI获得了1亿美金种子轮融资,轻松跨入全球十亿美金独角兽的行列。Stability.AI旗下产品Stable Diffusion是AI智能作画的产品,用户在该平台上只需要输入关键词文字,选择画作风格,就能获得高质量的画作。该公司在今年8月份发布并开源了Stable Diffusion AI 绘画模型,从而引发全球AI作画的浪潮。
由于资本和社交媒体的介入,AIGC今年爆火出圈也不难理解。但在流量和资本层层加码的背后,是AIGC在技术层和产品层的重大突破。
AIGC科普:为何2022年爆发?
AIGC(AI-Generated Content)是指运用人工智能技术自动生成内容的新型生产方式,与UGC(用户生成内容)和PGC(专业生成内容)相对应。
从本质来讲,AIGC是利用自然语言处理、计算机视觉等AI底层基础技术及能力,对外部用户输入的指令进行理解,并按照AI训练模型自动生成的内容。在2021年之前,AIGC模态中还是以文字生成为主。2022年,随着NLP(Natural Language Processing,自然语言处理)和扩散模型(Diffusion Model)技术领域的突破,AI可以更加精准地理解输入的词汇,并能根据细化的形容词描述,更高效地生成符合人类需求的、更加具象的多模态数据内容——包括但不限于文字、语音、代码、图像、视频、机器人动作等等。
根据模态不同,目前AIGC的相关产品被划分为音频生成、视频生成、文本生成、图像生成、多模态生成五大方向。
目前,全球AIGC赛道诞生了一批代表性的saas类企业。为了帮助企业更深入理解AIGC赛道及产品应用,36氪企服点评选取了一下几个赛道的头部代表性企业。
(一)AIGC文本生成
Jasper
诞生于2021年1月的Jasper 仅用了一年多的时间就成为了AI文字生成领域的行业翘楚。该公司主要从事AI文字生成业务,可应用于社交媒体、跨海电商、视频制作等多个新兴领域和行业,完成视频脚本、广告文案、电子邮件内容等创意性或重复性内容创作工作。
咨询产品
免费试用
Jasper 是 AI 内容平台,可帮助您和您的团队突破创意障碍,以 10 倍的速度创建令人惊叹的原创内容
Anyword
是一款人工智能文案工具,预测性能得分是Anyword的核心功能之一。该产品可以运用AI 在统计层面判断不同语言和版本的转换效果,从而确定哪种版本对受众更有吸引力。因此该产品可帮助营销人员、平台、出版物和企业提高转化率并增加受众。
rct AI
成立于2018年,运用人工智能为游戏行业提供完整的解决方案。 在不同类型和题材的游戏场景中,rct AI为游戏开发者打造的一系列解决方案,覆盖了游戏的全生命周期,包含智能内容生成、智能测试、智能数据运营、智能投放等类型。rct AI的混沌球(Chaos Box)算法可以在游戏中大规模地轻松生成具有智能意识的虚拟角色。他们的行为和对话不会重复,皆为动态生成。在游戏场景中,布署具有不同性格的智能 NPC,通过对话、行为等动态交互,增加玩家的游戏时长,同时提供新的变现途径。具体包括性格化NPC、对抗式 AI、互动式AI、大规模智能 NPC 部署、智能留存及智能运营策略等。
彩云小梦
主要定位为基于AI的智能化文本创作平台。作为一个有故事续写能力的人工智能“写手”,彩云小梦采用了大规模语言模型自研的自然语言处理模型,可以实现多类型文本的AI智能生产。用户只需要输入一段一千字以内的文字指令,就可以在一分钟以内得到风格多样、多元场景走向且能够自定义长度的文本内容。2022年1月,彩云小梦入驻喜马拉雅,两者分别作为AIGC在文字和音频赛道的头部选手强强联合,推出“喜小道”内容作品,实现了AI从文本创作到有声化演播的一体式生产。
(二)AIGC图像生成
受益于AI作画引发的全球社交媒体热潮,AIGC图像生成领域成为初创企业扎堆的热门赛道,也是融资事件数量和规模最大的赛道。
Stability AI的Stable Diffusion
以“免费开源”作为最显著特征的开源图像合成模型Stable Diffusion近来在AI绘画圈爆火,号称“最强文本生成图片”的模型。该模型采用的核心数据集是目前全球最大的开放图像-文本对数据集LAION-5B,包含了五千多亿亿个图像文本对。根据Stability AI的创始人兼CEO Emad Mostaque透露,Stable Diffusion能够在消费级显卡上实现DALL-E 2级别的图像生成,且生成效率提高了30倍。
Discord的MidJourney
是一款AI生成算图工具,也是获奖作品《太空歌剧院》的作者,目前架设在Discord频道上。在该平台上只需输入文字就会自动产生图像。Midjourney背后是一个小型自筹资金团队,专注于设计、人类基础设施和人工智能,目前已经有381万用户加入其Discord频道。Midjourney的大部分工作都通过Discord来完成,比如用户主要通过Discord的bot机制,通过提交Prompt(提示词)来获得图片。
文心·一格
定位为“AI艺术和创意辅助平台”,依托于百度旗下自研的飞桨、文心跨模态大模型,文心·一格可实现“一键生图”。根据百度集团副总裁吴甜介绍,文心·一格在运行中首先基于知识的Prompt工程理解用户需求,再基于扩散生成算法实现艺术画作生成,最后基于跨模态匹配大模型进行生成画作的结果排序,自动选出语义与美观度最佳的画作。
咨询产品
免费试用
文心·一格是基于文心大模型的文生图系统实现的产品化创新
ZMO.AI
来自杭州的 AI 技术初创企业感知阶跃(ZMO.AI)成立于2021年。该公司目前已完成 800 万美元的 A 轮融资,本轮融资由高瓴资本领投,GGV Capital 和 GSR Ventures 也参与了投资。ZMO.AI 最开始专注于出海,在海外推出的 imgcreator.ai 致力于帮助独立站卖家一键生成3D模特图,月活增长迅速。
(三)AIGC音频生成
Podcast.ai
是一个完全由 AI 生成的播客,每周都会深入探讨一个新话题。在第一期节目中podcast.ai 通过乔布斯的传记和收集网络上关于他的所有录音,用 Play.ht 的语言模型大量训练,最终生成了这段假 Joe Rogan 采访乔布斯的播客内容。
DeepMusic(灵动音科技)
公司致力于运用AI技术从作词、作曲、编曲、演唱、混音等方面全方位降低音乐创作及制作门槛,为音乐行业提供新的产品体验,提升效率。产品包括针对视频生成配乐的配乐猫、支持非音乐专业人员创作的口袋音乐、可AI生成歌词的 LYRICA、AI作曲软件LAZYCOMPOSER。
倒映有声
倒映有声致力于打造AIGC神经渲染引擎,通过自研的神经渲染(Neural Rendering)技术、数字孪生(Digital Twin)技术,TTSA(Text to Speech & Animation,即基于文本和语音合成实时生成音频和视频)技术,率先布局AI数字分身IP生态,并通过数字分身IP的人工智能来自主生成内容。2021年3月,倒映有声和中央广播电视总台音频客户端「云听」签署战略合作协议。
(四)AIGC视频生成赛道
视频生成是图像生成的延伸,也是元宇宙厂商的必争之地。两大巨头Meta和谷歌在这一领域竞争激烈。
Meta的Make-A-Video
Meta公司在9月29日推出的Make-A-Video是一款可以直接基于文字生成短视频的人工智能系统。据Meta公司透露,技术人员在开发该产品的过程中结合了几百万个视频和23亿张图片数据集数据来训练其模型,目前系统可以根据输入文字或者图片自动生成准确率很高的5秒钟短视频片段。
不过,Make-A-Video当前的智能创作还受到帧数(16帧/秒)、像素(768×768)等的掣肘,视频内容的动态效果有待提升。目前Make-A-Video的演示版本已上线,但用户需经过Meta的人工智能研究团队对Twitter账户的授权才能体验。
谷歌的Imagen Video和Phenaki
在Meta发布了Make-A-Video的一周后,谷歌也不遑多让,携注重视频品质的Imagen Video和主打视频长度的Phenaki这两款应用强势回归。相比于Make-A-Video,Imagen Video的视频清晰度和分辨率更高,采用串联扩散模型(CDM)、TSR与SSR等模型进行文本处理和图片解析,最终产生分辨率1280×768的5.3秒视频。该应用不仅能理解并生成不同艺术风格的作品,还能理解物体的3D结构,且继承了Imagen准确描绘文字的能力。
Phenaki则主打视频长度,在交互生成视频领域表现亮眼,可根据提示语智能生成极其贴近文本描述的2分钟以上的长视频,讲述一个完整的故事。此外,Phenaki还可以任意切换视频的整体风格与场景。
(五)AIGC的多模态赛道
多模态对厂商ai底层技术的巨大挑战。因此这一领域也是微软、谷歌、百度等全球顶尖ai公司“掰手腕 ”的赛道。
小冰
小冰是全球领先的人工智能科技公司,旗下小冰框架是全球承载交互量最大的完备人工智能框架之一,在开放域对话、多模态交互、超级自然语音、神经网络渲染及内容生成领域居于全球领先。
目前小冰在AIGC领域的产品包括小冰超级自然虚拟人、小冰人工智能内容生产、小冰智能座舱、音频生成产品X-Studio等。
腾讯AI 开放平台
腾讯AI开放平台汇聚顶尖技术,专业人才和行业资源,依托腾讯AI Lab、腾讯云、优图实验室及合作伙伴强大的AI技术能力,升级锻造创业项目。通过腾讯品牌、创投和流量广告等资源,为AI技术及产品找到更多的应用场景,实现产品从打造到引爆的全过程。