虚拟人的B端生意,巨头们的新战场

QiXin
+ 关注
2022-09-15 15:33
984次阅读

2022年,虚拟人更火了。作为元宇宙的“身份证”,每个进入元宇宙的人都需要一个甚至多个“化身”(Avatar)。

根据网经社发布的相关报告显示,2022年上半年,中国元宇宙赛道融资数达41起,融资金额达54.6亿元。其中,(虚拟)数字人相关融资21起,占25.92%。红杉资本、软银愿景、高瓴资本、纪源资本、经纬创投等顶尖资本以及网易、阿里、腾讯、字节跳动等互联网大厂,都在各自布局,甚至亲自下场试水。

企业名称

最新时间

融资轮次

融资金额

融资方

世优科技

20228

A++

1亿人民币

捷成股份

燃麦科技

20221

Pre-A

数千万人民币

SIG

慧夜科技

20221

Pre-A

数百万美元

顺为资本

次世文化

20222

A3

未披露

红杉中国

宙予科技

20222

战略投资

数千万人民币

凡创资本

呦呦科技

20222

天使轮

500万人民币

微尼斯科技投资

深锶科技

20222

Pre-A

千万美元

SIG

魔珐科技

202224

C

1.1亿美元

软银愿景基金

影眸科技

20224

Pre-A

数千万人民币

红杉中国种子基金领投,奇绩创坛跟投

极光社

20224

天使轮

数百万人民币

未披露

八点八数字

20226

Pre-A+

数百万人民币

拉尔夫创投

心识宇宙

20226

天使轮

数千万人民币

红杉中国种子基金

羿日动漫

20226

战略投资

未披露

优米加速器

世悦星承

20227

A

数千万人民币

凯辉基金,新世界策略投资,网易

AVAR

20227

天使轮

数百万美元

华创资本

奥贝赛维

20227

战路投资

未披露

遥望网络

拓元智慧

20228

Pre-A

未披露

银杏谷资本领投,卓源资本、汉仁资本跟投

幻方势代

20229

战略投资

未披露

小米集团

(图注:2022年虚拟人头部企业融资信息)

作为全球数字经济新贵,虚拟人赛道具有独一无二的特性。一方面,它连接C端社交应用,以完美外形赢得了众多粉丝,在直播、品牌广告、综艺、娱乐等场景持续活跃。比如洛天依、初音未来、柳夜熙、A-SOUL、许安一等。这些“永不塌房”的偶像正在成为品牌新宠,依靠“内容”核心打造IP商业生态。

另一方面,因为技术和成本的限制,虚拟人的主要买家还是B端企业,核心需求是降本增效,可复制可迭代可规模化。虽然这类需求的增长不如C端需求旺盛,但它们却决定着虚拟人赛道的上限和未来。

虚拟数字人,也被称为虚拟人、数字人、数智人等,广义上是指具有数字化外形的虚拟人物。

中国⼈⼯智能产业发展联盟、中关村数智⼈⼯智能产业联盟数字⼈工作委员会将虚拟数字人定义为:具有数字化外形的虚拟⼈物。具备以下三⽅面特征:⼀ 是拥有⼈的外观,具有特定的相貌、性别和性格等⼈物特征;⼆是拥有⼈的⾏为,具有用语⾔、面部表情和肢体动作表达的能⼒;三是拥有⼈的思想,具有识别外界环境、并能与⼈交流互动的能⼒。

人类可以自然地通过语言、表情、肢体动作等来读取所蕴含的信息和情绪,但虚拟人只能通过人工智能技术来识别外部语言,用算法来构建“灵魂”。

比如,在与真人对话场景下,通过自然语言理解(NLP)和自然语言生成(NLG)技术虚拟人能够识别文本/语音信息,通过知识图谱和深度学习技术,可以生成符合人类逻辑的自然回复;也可以通过关键词匹配知识库,做出自动化的回答。通过语音合成(TTS)技术,将回复模拟人的语音语调,通过语音驱动面部动画(ADFA)技术,驱动与语言相配合的面部表情。

综合来看,虚拟人涉及的AI技术包括:计算机视觉(CV)、自然语言理解(NLP)、自然语言生成(NLG)、自动语音识别(ASR)、语音合成(TTS)、语音驱动面部动画(ADFA)、机器学习(Ml)、深度学习(DL)、知识图谱(KG)、知识库(KB)、AIGC(人工智能自动生成内容)等。

目前虚拟人分为身份型虚拟人和服务型虚拟人两类。前者代表是虚拟偶像、虚拟主播等,大部分是具有类似真人的外形,特点是真人驱动,单向输出,商业模式上具有IP属性。

虚拟人的B端生意,巨头们的新战场(图注:韩国娱乐巨头SM推出的元宇宙女团aespa)

服务型虚拟人的典型代表是数字员工、虚拟客服、AI助手等,特点是双向多模态交互,计算机驱动,能与人进行双向的智能交互。其“驱动”的原理是基于深度学习等AI+技术,对大范围样本数据进行训练,形成特定的数据模型。利用算法和模型,虚拟人才能像真人一样去识别、理解信息,并自动去决策如何去反馈。

随着样本学习的范围扩大,数字员工的“业务范围”也会扩大,但不会超出特定专业。比如,万科首位数字化员工崔筱盼主要是财务部门的辅助,负责催办各种预付应收/逾期发票单据,后来随着样本数据的持续积累,她的职责扩展到了社保公积金信息维护,但基本没有跳出财务范畴。

还有红杉中国的数字虚拟员工Hóng,是利用深度神经网络渲染技术进行小样本专业学习,经过一周训练周期诞生,其定位是“投资分析师”,主看科技、医疗、消费领域的项目,可以在一秒钟内阅读上百份商业计划书,并按照行业属性、融资阶段作出信息提炼和总结。

总的来看,B端虚拟人生意通常具有三个显著特点:

  1. 对拟人化有更强需求。比如智能客服,老人/孩子情感陪伴机器人等,可以一定程度上替代真人。
  2. 垂直专业领域。因为目前还没有具备诞生通用性强人工智能的技术条件,深度学习主要是在垂直专业领域的样本学习。比如AlphaGo打败了所有人类骑手,AlphaGoZero只训练了3天就击败了AlphaGo,但所有比赛都局限于围棋。
  3. 产品/服务标准化、可规模化复制,从而降低企业人力运营的成本。从这一点来看,C端虚拟偶像/明星因为需要定制化,不符合这一特点。

综合来说,目前国内的虚拟人玩家主要有三类:基础层、平台层和应用层。

基础层玩家主要是动捕/建模/渲染/XR(扩展现实,包括VR/AR/MR)软硬件厂商。

比如硬件厂商代表有:亦腾、凌云光、Xsense、影创科技、青瞳视觉等,主营业务是动捕/光学/VR/传感器等硬件设备。既有入门级设备,也有专业级高清设备。比较昂贵的光学动捕设备从十几万到几十万不等,惯性动捕、设备相对价格更低,但整体成本也在万元级别,且设备较为笨重,需要专业影棚环境。

因为动捕设备和识别算法的进步,目前建模已经可以利用成本较低的计算机视觉动捕技术。这种技术需要的设备较为普遍,比如手机/电脑的内置摄像头,甚至一张照片,一段视频就能实现建模。虽然精度确实不高,但却大大降低了行业准入门槛。

软件类厂商主要有相芯科技、叠镜数字,虚谷未来,环球墨非、云舶科技、半人猫等。此类厂商主要聚焦虚拟数字人的建模/渲染环节,在计算机视觉方面具有深厚积累,具备快速构建虚拟人的能力。比如虚谷未来

此外,还有一类偏内容的综合类厂商,代表如世优科技、燃麦科技、次世文化、八点八数字、AVAR、世悦星承等。这些厂商都定位于综合性的数字人技术服务商,能提供全链路的虚拟人产品,但从根本上来说,这类玩家的核心业务是“虚拟人IP/数字资产运营”,但却具有“技术+内容”的双城优势,一方面连接B端的技术类厂商,一方面连接基础层的软硬件厂商,还能连接C端内容市场,提供IP经纪人等延伸服务,能快速满足中小型客户的定制需求。

这类厂商一般拥有丰富的虚拟IP资产,具备很强的内容能力,且旗下一般有自己的明星IP。比如次世文化的迪丽冷巴/韬斯曼,燃麦文化的AYAYI,世优科技的阿央、小缪、小爱同学,八点八数字的九黎和高圆圆等。

虚拟人的B端生意,巨头们的新战场

(图注:从左到右依次为:翎Ling、AYAYI、小漾)

第二类是平台层玩家。这类厂商的核心玩家有三类:一是AI背景厂商,二是互联网大厂,三是垂直ISV(独立软件开发商)。

1、AI厂商

AI背景类厂商如AI四小龙——商汤、旷世、云从和依图,还有微软小冰、科大讯飞AI虚拟人、追一科技、标贝科技等。这类厂商主要的核心产业是人工智能技术及其应用,虚拟人业务只是对底层技术的包装和应用,而不是主营业务。

因为AI厂商主攻的技术方向各有侧重,因此各家虚拟人业务重点也不一样。比如商汤的SenseMARS Avatar应用的“杀手锏”,是商汤在视觉AI/人脸识别领域的核心优势,可以利用照片/视频生成人物的虚拟化身。科大讯飞则聚焦虚拟主播场景,也是自家AI智能语音技术优势的延伸。微软小冰模型偏重于内容识别、情绪识别和深度学习等方向,是比较通用的开发框架,业务体现就是人工智能内容生产、AI托管小编、x-Eva虚拟人情感陪伴等。

2、互联网大厂

互联网大厂也是平台层的重要玩家。目前,大厂在虚拟人生态也各有布局。百度智能云曦灵、网易伏羲,火山引擎、杭州李未可(字节独家投资)、腾讯云小微数智人、阿里云(达摩院XR实验室)、华为云(MetaStudio数字内容生产线)等。

综合来看,大厂试水相对谨慎,通常与自身业务有更加紧密的关系。比如网易伏羲三大产品线中,除了有灵虚拟人之外,其它两大产品AI反外挂和AI竞技机器人都应用于游戏场景。此外,网易还开发了沉浸式活动系统“瑶台”,在海外投资了3D虚拟人物社交平台IMVU和制作3D虚拟化身的公司Genies。

字节跳动在虚拟人布局,一方面是火山引擎自带的虚拟人形象制作工具,另一方面则是硬件上独家投资李未可,这家公司的核心业务是量产型XR(扩展现实Extended Reality)眼镜,再加上社交APP“派对岛”,字节的整体布局充分体现了对于未来元宇宙社交的野心。

在企服领域,阿里、华为、腾讯、百度四大云服务厂商,目前都已上线了虚拟人产品/解决方案,但基本都隶属于人工智能产品线的子模块,更像是对自家过去的AI技术/产品做了一个打包和封装,形成新的场景/行业解决方案。

3、垂直ISV厂商

虚拟人垂直赛道的ISV(独立软件开发商)玩家都十分重磅,也是B端的核心玩家。代表企业如中科深智、魔珐科技、拟仁智能、黑镜科技、心识宇宙、影眸科技、诗云科技、深锶科技等

这类厂商大多都具备一站式全链路虚拟人技术/产品和服务能力,但与前文提到的偏内容向的综合类厂商不同ISV厂商主要是将虚拟人能力封装成标准化的SaaS,以更低的成本和更轻量的方式,提供给B端企业。无需采购笨重的硬件和昂贵的驱动软件,也不需要专业人才,即走即用,高效方便。

综合来看,这类常常主要聚焦两大业务方向:一是快速批量的虚拟人形象生成,二是虚拟内容的合成。

方向一,平台一般会提供大量预设模板,可以让企业自主设定虚拟人的性别、形象、声音等参数,快速一键形成半个性化的虚拟人形象,也可以根据个人形象(真人或者照片)快速形成3D线上虚拟分身。

方向二,虚拟内容能力,则是利用基于TTSA技术(文本驱动语音及动画技术),STA技术(语音驱动动画技术),将输入的本文转化为语音,并通过虚拟人形象自动合成音视频,后期用户还能按照时间轴对音视频进行细节调整。

第三类是应用层玩家、主要是来自影视、传媒、游戏、金融、品牌、政务、医疗等行业的头部企业。如新华网、阿里、腾讯、网易、浦发银行、光大银行、平安银行、抖音、B站、蓝色光标、芒果超媒、浙文互联、华扬联众、米哈游、花西子,欧莱雅,肯德基等。

应用层玩家扎根于自身的业务场景,在技术和内容上更符合自身的品牌特性。比如银行场景下,虚拟人主要突出客户服务的业务属性。而在抖音、B站等娱乐平台上,目标则是打造虚拟人内容矩阵,探索未来元宇宙的商业落地生态。而花西子、欧莱雅等美妆护肤品牌,则是将虚拟人打造成为品牌代言人,在短视频直播场景下持续探索新的商业模式。

因为虚拟人市场的特殊性,B端技术/产品厂商与与C端的内容厂商不可分割。在目前的初级阶段,国内虚拟数字人市场也出现了一定的混乱,导致行业同质化竞争严重。这也为用户采购带来了一定的困难。

目前行业的总体趋势是融合的。不论是软件还是硬件厂商,不论是B端还是C端厂商,都在向一体化解决方案/供应商转型。比如,动作捕捉设备厂商一般会搭配售卖软件,AI迈向直播场景提供解决方案,独立ISV自研AI算法,IP运营商连接上下游厂商打造明星IP等。

在此,36氪企服点评盘点以下十家虚拟数字人头部公司/软件,供企业选型参考。

小冰虚拟人基于特有的XNR(深度神经网络渲染技术)技术,通过深度学习在大量数据中提取特征,加速传统的渲染流程。用户只需输入语音或文字,即可驱动虚拟人的表情、唇形等,完美复刻训练目标的神态、气质、形象,让虚拟人的视觉效果更加近似于真人。小冰的数字孪生产品为用户提供集数据、虚拟人定制与管理、直播分发的完整解决方案。

迅飞开放平台是科大讯飞推出的移动互联网智能交互平台,为开发者免费提供:涵盖语音能力增强型SDK,一站式人机智能语音交互解决方案,专业全面的移动应用分析。旗下产品AI虚拟主播解决方案,用讯飞的语音合成、人脸建模、形象驱动、图像处理等多项人工智能技术,实现了文本到视频的自动输出,并支持主播多语言视频生成。

深圳追一科技有限公司是领先的人工智能公司和AI数字员工提供商,我们主攻深度学习和自然语言处理,提供智能语义,语音和视觉的AI全栈服务。 我们的AI数字员工智能平台能与业务场景深度融合,提供不同类型的AI数字员工,满足企业和政府用户服务、营销、运营、 办公等多种场景的智能化升级需求,帮助他们降本提效,改善用户体验,驱动创新和增长。

芯科技创立于2016年,以“元宇宙搭建者”为发展愿景,以“创造更真实的数字世界”为企业使命,专注于计算机图形学和人工智能技术的深度融合, 推动XR技术创新和产业应用,自主研发的“虚拟数字人引擎”和“超写实数字物平台”已在逾千家国内外企业得到规模化应用。

https://www.faceunity.com/about.html

火山引擎本身提供AI智能应用类saas产品,包括人像人体、机器翻译、内容定制、机器学习等应用。平台还提供虚拟形象生产平台,为Web端虚拟形象内容生产工具,旨在结合视觉、语音以及服务端渲染算法,实现基于虚拟偶像/卡通形象/数字人/真人重建等虚拟演员的内容制作能力。

北京中科深智科技有限公司成立于2016年,其核心团队来自于北京大学、中国科技大学等高校,拥有游戏制作、硬件、算法、美术等技术和内容制作全流程相关专业人员,提供多模态动作生成驱动引擎。

结合自研或第三方智能对话系统及第三方引擎,实现造人,育人,用人,提供一站式构建AI虚拟人产品的能力。

“AI虚拟人SaaS云服务平台”,拟仁智能是一家以智能虚拟人为核心的新一代人工智能云服务平台,用户无需具备人工智能、计算机图形学等专业知识,只需在设备端集成平台所提供的SDK,就可以在自身应用中轻松拥有栩栩如生的、具备AI智能的、可配置和升级的数字人物角色,进而为智能汽车、金融电信、网络直播、广告营销、旅游文创、元宇宙等各类应用场景提供高品质的智能虚拟人服务。

MindOS采用心识宇宙自研的智能心识框架,突破了传统Al单点能力的限制,让虚拟人不仅能与人语言交流,还能有视觉、能认知推理、有自己的记忆和个性,让虛拟人真正有可能成为元宇宙的原住民,去陪伴、服务每一个用户。

世优科技力在为客户提供以更优技术、更优产品、更优创意、更优服务为价值核心的“4U”体验。同时,通过直接或间接的方式与国际一流厂商(包括:Intel、NVidia、Dell、Matrox等)合作的技术经验和前瞻视野,世优科技将积极推进快速动画技术的研究和推广工作,力争把核心技术与产品做深做透。

 

 

 

[免责声明]

原文标题: 虚拟人的B端生意,巨头们的新战场

本文由作者原创发布于36氪企服点评;未经许可,禁止转载。

资深作者QiXin
0
相关文章
最新文章
查看更多
关注 36氪企服点评 公众号
打开微信扫一扫
为您推送企服点评最新内容
消息通知
咨询入驻
商务合作