素质教育进化,音视频探路新风口
近日,中共中央办公厅、国务院办公厅印发了《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》,学科类培训机构一律不得上市融资成定局。教育培训机构转型迫在眉睫,素质教育赛道是其中的一个趋势。随着美育被纳入中高考,相关课程学习变成刚需,教育政策向「音体美」方向靠拢,以思维训练、能力培养以及艺术素养为代表的素质教育呈现「线上化」趋势。市场表现最为突出的是,各大在线教育公司都在开辟「音体美」的在线教育场景。
除了政策驱动,素质教育在线化的快速发展还依托于实时音视频技术的不断加速。拍乐云创始人兼 CEO 赵加雨认为,用户体验是在线教育产品的核心竞争力之一,更具互动性和沉浸感的在线课堂体验将会有效提升学员的学习效率,也是影响续费率和转介绍率的重要因素。
作为一家成立于 2019 年 8 月的音视频公司,音视频领域的「黑马」,拍乐云从最难的素质教育切入,服务教育领域的互动全场景。
「我们的愿景是构建云上的每一次美好互动。」
说出这句话的是一家成立两年的音视频公司「拍乐云」的创始人赵加雨。这家公司的核心团队成员均来自音视频的黄埔军校思科 WebEx。
WebEx 是云视频会议的开创者,在视频会议领域有着不可撼动的地位。2007 年,这家公司被思科纳入麾下。当时,WebEx 在视频会议领域的市场占有率达到了 70% 以上,近乎占垄断地位。
从创业核心团队背景来看,拍乐云是国内第一家视频会议背景的实时通信云服务商,汇聚了一大批专注于音频、视频、网络、AI 等领域的资深技术专家。
2003 年,毕业于东南大学计算机系的赵加雨加入 WebEx,历经 14年一路晋升为 WebEx 中国高级经理、WebEx 美国架构师。2017 年,他离开美国,进入网易云信担任 CTO。
2019 年 8 月,赵加雨看见了音视频为行业及社会带来巨大价值的潜力,便毅然开始了创业之路。公司成立后即获得了红杉资本领投的天使轮融资。
碰巧的是,早在三年前,红衫资本就曾投资与拍乐云一样团队背景的公司——Zoom。Zoom 在 2017 年初获得红杉资本 1 亿美元的 D 轮融资。当时红杉资本发言人表示,多年来视频会议行业都没有一款真正受用户欢迎的产品,直到 Zoom 出现。
「我们跟 Zoom 基因一样。」赵加雨向多鲸表示,拍乐云的核心团队都来自于音视频的黄埔军校「WebEx」,跟远程办公平台 Zoom 的背景一样。Zoom 的创始人袁征是赵加雨的多年好友、昔日领导。
直到 2020 年疫情来袭,当时创业不到半年的拍乐云迎来了新机遇。「云上生活」成为人们熟悉的体验。音视频技术在办公、教育、医疗、娱乐等垂直场景中大放异彩。「随着疫情加速线上化、5G 及互联网加速等多种因素叠加,未来留给音视频公司的机会越来越多。」赵加雨说。
赵加雨发现,视频会议中积累的音视频技术可以很好地应用到教育场景中。因此,拍乐云通过 PaaS 的方式输出实时通信能力,将视频会议技术封装成简单易集成的 SDK,客户通过集成 Pano SDK 即可在自身应用里实现音视频通话、互动白板、互动直播、云端录制等各种能力。企业和开发者可在全球范围内快速构建 1 v 1、互动小班、超级小班、双师大班等教学班型,实现 K12 教育、美术教学、音乐教学、编程教育、少儿英语、职业教育等多种场景互动。
「音视频行业现在谈市场市占率还尚早」,此前多鲸采访的投资人反馈到。这就意味着,很多音视频公司已初成规模,但也无法囊括所有客户的场景需求。同时,不同教育场景对实时音视频技术也提出了更高的要求,如 1 V 1 要求极低的延时、小班课要求更强的互动性、大班课要求超大并发、在线钢琴陪练要求更好的音质和更丰富的画面、在线美术教学要求保证图像的色彩和不变形、在线编程教学要求有稳定的远程控制和视频标注能力。
「无论是产品,还是功能,我们都想把『能用』变成『好用』。」赵加雨说。他表示,现在很多音视频厂商的音视频能力仍有许多需要提升的地方。
赵加雨是在内业第一个提出实时音视频「两高一低」概念的人,即:高质量、高流畅与低时延。实时音视频非常讲究「两高一低」,即高质量、高流畅与低时延。「为了实现实时音视频的两高一低,需要在系统架构、音视频编解码、全球组网、服务端分发、弱网对抗等各个环节做到最优。」他表示,这也是拍乐云的独特之处。
除了针对不同场景的取舍之外,拍乐云还做了更为细致的调整,比如根据不同场景选择不同的抗弱网算法。即使在弱网状态下,也可以保障高质量、高流畅和低时延。
拍乐云希望在兼顾「两高一低」的情况下,将「能用」做到「好用」。所谓「能用」只是功能的简单实现,要做到「好用」就必须在功能实现的基础上,再为客户增加一层考虑,比如在在线课堂上实现更好的互动感和沉浸感。
以互动白板为例,作为在线教育场景下刚需最强的功能,最容易出现的问题是笔迹同步不及时、动效课件失真、音视频同步录制不及时等问题。针对这些难点,拍乐云做了很多方面的技术实践。
一是针对低时延,笔迹同步不及时问题,拍乐云采用私有数据格式,进行极致压缩,确保数据量尽量小。在白板绘制和渲染时采用原生技术,确保内存占用更低、CPU 消耗更小。在网络传输上利用全球加速网络 Pano Backbone 确保跨国、跨运营商的实时传输。
二是针对动效课件失真问题,拍乐云自研转码引擎和白板引擎,可以做到动态课件的超高保真,也可以支持各种动效和音视频文件播放。
三是针对白板和音视频同步录制和同步推流问题,拍乐云提供了白板转视频流的能力,让白板和视频能够同步录制在一个视频文件中,也可以同步推流到 CDN 直播中。
从市场供给角度看,很多教育机构会选择无需研发的SaaS产品,产品基本能用就行,部分机构会基于音视频PaaS自研在线课堂,也多是出于品牌和数据等考虑,对于互动性和沉浸感要求都不高。赵加雨则认为,用户会倒逼音视频机构提供更加优异的在线课堂服务。「我们能做的是,引导客户使用,当他知道『可以变得那么好用的时候』,就会更加接受这种新的产品。」
让产品更加好用的本质是什么?赵加雨向多鲸提到「know-How」。做音视频产品,并非靠单个模型和算法就能搞定,也没有现成的方案。为此,他的考虑是,做技术要考虑得面面俱到,各节点之间要相互平衡,深刻理解技术。
起初拍乐云并未直接将业务定位在素质教育,直到在洞察不同细分教育赛道客户需求时,才确定方向。「素质教育客户的需求并未被现有厂商充分满足。」赵加雨谈到。在拍乐云的所有客户中,素质教育细分领域的客户占比最多。
对比看,在拍乐云所服务的客户当中,K12 教育的音视频需求大部分围绕授课需求展开,1 对 1 或者 1 对多的多人通话便可满足需求。而素质教育面向的教学场景相对琐碎且复杂,功能相对多元。因此,拍乐云从最难的素质教育切入,服务教育领域的互动全场景。
在线素质教育涉及钢琴陪练、音乐教学、在线美术课、在线书法及在线编程等,声音的清晰传达、画面的精准传递及情绪的即时表达是重点,这需要老师在线上教学的过程中即时沟通与实时反馈,因此对实时音视频技术要求较高。
例如,在钢琴教学场景方面,对声音进行处理,保证全频段声音从采集、编码到前处理都非常清晰,让线上音乐的传输不失真。
一方面,既需要满足在线教育场景的低延时、高流畅性、高互动性以及高并发性,另一方面,又要解决特定线上素质教育场景的痛点,因此音视频公司需要做出更大的投入。
在 K12 学科培训强监管的形势下,国家正鼓励青少年从「内卷」的校外学科培训,转向全面发展的兴趣教育。而音体美正好是政策层面积极鼓励的方向。
针对市场需求与政策风向,拍乐云聚焦了素质教育的美术细分,推出了美术教学音视频解决方案。在美术线上课堂上,拍乐云可提供高清视频、多摄像头、角度矫正、视频标注等功能。例如通过高清编码可以保证图像色彩的高度还原;通过多摄像头功能可以实现老师、学生双向同步看到对方的视频和画板;通过角度矫正可以将画板调整为正对拍摄的效果;通过视频标注能力可以随时指出绘画时的重点和要点。
这当中最大的难点在于如何在实时视频过程保证画纸图像不变形。拍乐云通过几何失真参数估计、映射关系计算等低复杂度高效率的毫秒级视频处理算法对原始视频进行矫正处理,解决美术视频教学中产生的画纸变形问题。
眼下,整个素质教育赛道将迎来热潮,随着更多的选手入局,行业的竞争势必会加剧。赵加雨认为,毫无疑问的是,无论是学科教育还是素质教育,借助资本的力量蒙眼狂奔已无成功可能。回归教育的本质,踏踏实实做好产品和口碑,才是长存之道。
至此,关键词「好用」只是拍乐云在音视频领域树立竞争力的一半,当与「简单易用」合为一体便呈现出拍乐云核心竞争力的全貌。
对产品、服务的重视都非常关键。拍乐云从核心技术点突围,降低教育企业使用音视频技术的门槛,让企业更专注于构建自己独特的优势。
事实上,不断帮助客户实现音视频功能的「优化」也已经贯彻到拍乐云的产品体系中。
赵加雨一直坚持的产品理念是,要做「高内聚、低耦合」的产品技术,这指的是把很多复杂的技术要素藏在系统内部,而开放给到用户的交互接口是极简的。
他提到一个共享的例子,很多厂商没有提供移动端屏幕共享的能力,很多教育客户在接入的时候,并非理解有关共享和视频的很多基本概念,对于他们而言,学习成本和接入成本比较高。于是拍乐云就做了一个移动端屏幕共享的功能,将所有的功能封装到 SDK 内部,让移动端的共享更加易用。
在拍乐云,所有的创新、产品迭代以及研发都是围绕客户需求开展。赵加雨表示,「想要做出被众多客户使用的世界级音视频产品是很难的,但拍乐云愿意与客户共同打磨产品,共创场景应用,立志成为世界级的音视频产品。」
未来音视频行业的竞争将聚焦在技术本身。如何将产品从「能用」变成「好用」,持续考验音视频公司在技术方向的精进能力。尤其是 AI、VR 和 AR 等技术的成熟,将愈发考验各家的技术创新能力、新技术应用落地能力。
正如拍乐云创始人赵加雨所说:「2B 企业服务一定是由产品和服务主导的,我们将始终坚持与客户一起,探索行业对于实时音视频的更多场景和更高要求,打造服务的品质,保持对技术的匠心,对教育的敬畏之心,稳步求进。」
本文来自微信公众号 “多鲸”(ID:DJEDUINNO),36氪经授权发布。