编者按:本文来源于“每日商报”,作者 严韵倩,原标题《实际场景需求驱动AI技术不断演进网易数帆:推动全行业智能化》,36氪经授权转载。
在游戏界面中点击按钮开始录音,内置的语音识别系统几乎瞬间就能将语音转换为文字,再点击“发送”,一条应用人工智能技术、由机器参与完成的文字消息就出现在了游戏屏幕上。整个过程可以像语音一样实时与其他玩家交流,一点也不耽误游戏操作和对局节奏。在网易旗下的多款游戏中,玩家们早就习惯了这项语音转文字的功能。
它所依托的AI语音识别技术,是由杭州网易数帆科技有限公司(简称“网易数帆”)自研开发的。
事实上,除了游戏业务,这一技术还应用于网易旗下多个产品中。在网易云音乐中,基于语音识别技术获取歌词的时间轴信息可用于制作实 时歌词,以及在音视频直播中对主播语音进行识别,辅助进行审核与分析;在网易新闻中,对用户上传的短视频进行语音识别,用于内容审核;在有道词典的语音翻译功能中,对用户的语音信息识别为文字信息再进行翻译……
7月16日,在杭州网易数字+大会上,网易集团旗下云计算和大数据品牌网易云宣布正式升级更名为“网易数帆”,将持续深化场景化服务,并针对企业数字化需求,优化和升级业务与战略,聚焦基础软件领域业务,以更主动、更激进的姿态打入企业数字化转型服务这条To B赛道。
几个月后,在11月举行的乌镇世界互联网大会上,网易数帆首次亮相“互联网之光”博览会,展示了全链路数据生产力平台、一站式软件生产力平台等云原生、大数据、人工智能领域的最新技术。目前,网易数帆已发展出四大业务线:云原生软件生产力平台网易轻舟,全链路数据生产力平台网易易数,多媒体智能开放平台网易易智和全维度质量效能平台网易易测。其中,四大业务线中的网易易智主要以人工智能技术提升企业智能化水平。
作为网易技术的孵化器、人才的培养基地和市场的发动机,网易内部设有杭州研究院,主要用于创新业务孵化、基础技术平台研发和前沿技术研究。网易数帆也是从这里孵化的,因此,尽管它是一个仅4岁的年轻品牌,背后却有着网易集团二十余年的互联网技术积累。
据网易易智总经理胡光龙介绍,网易是国内最早一批研究并应用AI技术的互联网公司。2011年,网易邮箱推出了一项邮箱账号安全功能——人脸识别,可通过摄像头识别人脸信息,对用户身份进行认证,防止邮箱账号被盗,加强邮箱安全保障。“这其实就是比较早期的AI技术应用案例,人脸识别功能的基础是AI技术中涉及视觉方面的图像识别。”胡光龙回忆说,“不过在当时,这一技术并没有大规模地进入移动互联网行业,更没有互联网企业在用户安全方面运用人脸识别系统的先例,用人脸识别辅助产品安全是我们基于网易本身的产品线而做的尝试。”
胡光龙认为,无论在什么时代,数据始终是人工智能领域中非常宝贵的资产。
海量的自有数据是网易数帆发展AI技术得天独厚的优势。区别于很多企业,网易的技术研发逻辑有着鲜明的特征——从业务需求、产品应用出发。
比如研发语音识别系统,最终还是为了解决网易内部各项业务遇到的实际问题。从2013年开始,网易数帆(彼时还是网易杭州研究院)研发的语音识别系统,经历了从最初原型系统到后期逐步完善优化直至大规模应用三个阶段。
在早期,其语音识别系统在识别精度和识别效率上都不甚理想,随着深度学习技术在人工智能领域的发展,网易多款产品内的实际场景数据发挥了巨大作用,网易数帆在过去的基础上开发了一套端到端的语音识别系统。
对于这套系统的评价,胡光龙用了两个关键词——“漂亮的框架”和“质的飞跃”。系统的好处不言而喻,能够满足网易业务发展尤其是国际化的需求。例如,一些全球同服的游戏,用户语音转换文字时,会同时有中英日韩多种语言需要支持;语音翻译应用,目前需要先选择语种再说话,实际应用中容易选错导致无法识别……这些实际的业务场景需求,都驱动着AI技术不断演进升级,朝着更成熟的方向发展。
自上线以来,网易语音识别系统已为游戏、教育、音乐、传媒、企业服务领域的多个产品提供持续稳定的服务支持。在电商智能客服等领域,经过针对性的定制优化,识别性能达到行业领先水平。
网易一直擅长的,就是在大市场的细分领域站住脚跟。网易数帆在更名之后进一步明确了自己的定位,在一个开放兼容的生态环境中,创造独特的价值并与之兼容,沿着设定的核心业务线发展和深化。
在疫情催化之下,智能化技术飞速发展,企业数字化转型需求也日益旺盛,为各行各业带来新的发展痛点和全新的业务场景。企业如何降低技术门槛、转型风险和成本?内部系统多,数据孤岛严重,数据如何支持决策?线上教育如何最大化利用师资力量,又能满足学生高效复习和答疑的需求?这些问题,是金融、教育、物流等行业企业今年在面临数字化时遇到的“灵魂叩问”。网易数帆在帮助企业数字化转型时,会用AI技术或者基于这一技术的思路尝试解决其他行业内部的问题。
“人工智能领域的很多技术都可以在各行各业找到‘用武之地’。”胡光龙说。比如在火热的直播行业,基于自学习语音识别技术、视频分析及自然语言理解等技术,可以对文本、图像、视频进行分析和理解,用于视频直播字幕、质检审核、内容分发等业务场景,还能将文字信息转化为声音信息,用于虚拟主播、直播变声场景等。
“直播行业还算是带着互联网基因,能与新技术快速融合,但同样,传统行业也需要AI技术赋能自己的业务。”胡光龙举了一个简单的例子,在绝大部分企业的报销现状中,普通员工报销流程复杂繁琐,财务人员日常工作单据处理量大、对账繁琐等,但用上OCR(光学字符识别)和NLP(自然语言处理)这些AI技术可以大幅度简化流程。“当然,我们也仍然在探索,从小处着手,一步一步推进各个行业的智能化。”
今年7月以来,网易数帆已先后与浙商银行、深圳证券交易所、好未来教育集团、济民可信集团、国家超级计算中心济南中心等多领域大型企业和机构签约,提供数字化转型服务。
发现未来独角兽,项目BP发过来!
如果你的项目足够优秀,希望得到36氪浙江的报道,参加36氪浙江的“未来独角兽活动”,请将你的需求和BP发至36氪浙江项目征集邮箱:zhejiang@36kr.com,我们会及时回复。
36氪浙江——让浙江创业者先看到未来!