智能教育卷入GPT混战,三路玩家火拼,“AI老师”成标配
7月6日,2023世界人工智能大会将正式开幕,据悉,30余款大模型都将悉数亮相,这其中就包括科大讯飞星火认知大模型、网易有道子曰大模型、百度文心一言大模型等。在“百模大战”的背景下,大模型也正在搅动教育市场。
近日,第二款小度青禾手机通过了3C质量认证,距离小度正式发布上一款手机仅40余天,在智能手机市场遇冷的当下,百度入局造手机受到了外界的关注。百度并非入局与手机厂商“厮杀”,而是选择了智能教育硬件赛道,推出的旗下首款手机也是一款搭载AI学习大模型的手机。在此之前,科大讯飞已经将其科大讯飞AI学习机T20 Pro接入星火认知大模型。
除了这些已经落地的智能教育硬件产品,此前网易有道还推出“子曰”大模型及AI口语老师的剧透视频;学而思也称,正在自研数学大模型MathGPT;作业帮也于上月开始内测基于中国市场的教育大模型。在ChatGPT推出半年后,适合大模型落地场景之一的教育领域,玩家们频现新动作。正如华创证券指出的那样,具有多轮对话、多语言理解能力的大模型与教育天然适配。
不仅如此,教育板块也延续涨势,就在星火认知大模型发布后的第一个交易日,科大讯飞的股价再度涨停,收报63.86元,此外,今年以来,科大讯飞的股价已经多次创历史新高。在线教育平台高途在6月8日涨幅达到了19.54%,创今年3月以来单日涨幅新高。
中金公司在研报中指出,年初至今市场持续高企,上一轮行情催化主要集中于大模型的突破进展,模型层涌现后,下一阶段AI产业趋势将更多由应用端催化。东北证券更是提到,2023年将成为AI+教育应用爆发之年。比起国内的情况,多邻国、Quizlet等海外在线教育平台不仅推出智能教育助手,还已经摸索出较为成熟的商业模式。
针对大模型可能给教育行业带来的影响,同济大学大学校长在接受媒体采访时称,以ChatGPT为代表的大模型将改变人类获取知识的方法,过去是老师和学生的二元结构,而今天,机器在很多领域都干得比老师还好,因此,未来的教学方式,可能会拓展为老师、机器、学生三元结构。
那么,现在有哪些玩家已经入局推动大模型落地教育,生成式AI又将如何赋能教育全流程,大模型落地教育还要面临着哪些问题和挑战,我们试图追踪当下市场上的各路玩家的最新动作来找到这些问题的答案。
目前来看,在线教育平台、互联网科技企业、AI创企等三路玩家参与着大模型在教育场景的落地。但参加内部参与企业最多的当属在线教育平台,他们一般接入其他公司的大模型,并对已有产品进行优化,较少推出智能硬件产品。从各家推出的AI家教、AI助手等来看,未来在线教育或朝着类人辅导的方向发展。
今年2月,国外一家名为Quizlet的在线教育平台推出了接入ChatGPT的AI家教Q-Chat。随后,另一家国外在线教育平台Khan Academy推出的Khanmigo也接入了ChatGPT,同时也具有类似AI家教的功能。事实上,在接入生成式AI之前,一些在线教育平台就已经推出所谓的“AI家教“功能,只是以往的那些AI家教大多依靠推荐算法,推荐录制好的教学视频和解题方法,而无法针对视频和方法中的某些细节给出解答。
何来理解“类人化”的AI家教呢?简单来说,以往学生不会数学题拿软件来搜,最多也就搜到有解决步骤的答案,再好一点就有一个讲解视频,但是讲解视频和原题的关联有多大?或者能不能讲清这一类型的数学题目?这都是以往学习软件保证不了的。
而AI家教不是“一份答案”或者“一段讲解视频”。当学生不会某个题目的时候,AI家教先不给答案,然后引导学生自己写,当学生写错的时候,AI家教才来针对学生不会的地方进行讲解。而以往的AI家教大多依靠推荐算法,推荐录制好的教学视频和解题方法,而无法针对视频和方法中的某些细节给出解答。
值得一提的是,国外在线教育平台Khan Academy推出的Khanmigo除了学生端的AI家教功能,更是推出了教师端的“助教”,开启“教师模式”后Khanmigo,会指导教师制作教案,同时还能帮助老师收集材料等,从而节省教师的备课时间,使教师可以将更多时间花在与学生互动身上。
国外在线教育平台推出的AI家教Q-Chat
相较于全学科教学的AI家教,国外语言学习网站Duolingo结合自身品牌特色推出了更加细分的生成式AI服务。3月,它推出了Duolingo Max订阅服务,订阅服务中新增了Explain My Answer和Roleplay等两项功能。
Duelingo Max订阅服务新增Explain My Answer和Reloplay两项功能
Explain My Answer这项功能就和字面意思一样,当用户在遇到学习上的难题又看不懂答案时,智能学习助手就会针对这个问题为用户讲解,并为用户提供更多的示例。以往没有接入大模型的在线平台无法进行这样一对一的具体化辅导。
而Reloplay可以理解为,用户和可以多邻国中的各种AI角色进行互动交流,这样用户不仅不需要专门请一个口语老师来指导自己的口语,而且还不需要去“口语角”找不同的类型人进行练习。
用户使用Reloplay功能,与AI角色进行互动交流
学而思是目前没有接入其他公司大模型的在线教育平台。近期它宣布研发面向全球数学爱好者大模型MathGPT。学而思AI团队负责人指出,将大模型落地数学领域,AI需要具有更加准确、清晰、强大的逻辑推理能力,且容错率低,但目前通用大语言模型的性能表现还无法取得突破。
学而思还做了这样一个比较形象的比喻,“通用语言模型就像一个文科生,它在语言翻译、摘要、理解和生成等任务上有出色的表现,但在数学问题的解决、讲解方面则存在明显不足。”更具体一点来说,就是解答数学问题经常出错,有些数学问题虽然可以解决但是方法更加偏向于成年人,无法针对适龄儿童的知识结构和认知水平做出适配。
学而思称,目前MathGPT已由首席技术官(CTO)田密负责,2023年春节前该项目已经启动相应的团队建设、数据、算力准备和技术研发,并准备招募全球范围内的优秀AI专家加入。
除了此前这些在“教育赛道”积累了大量用户的在线教育平台,另外一股推动“大模型落地教育”的玩家是互联网科技企业。这些互联网科技企业此前就在教育赛道有所尝试,同时自身在大模型领域具有优势,“万事俱备”的它们还抢先在线教育平台一步推出了智能教育硬件产品。
国内最先宣布推出自研大模型,并在教育领域落地的互联网科技企业是网易有道。3月底,它称将要发布“子曰”大模型,并开放基于“子曰”大模型研发的AI口语老师和中英文批改的DEMO。在第六届人工智能大会上,网易“子曰”大模型成果AI口语老师还将首次亮相。
网易有道AI口语老师剧透
虽然科大讯飞和小度的大模型进度稍稍落后于网易有道,但这两家公司都推出了智能教育硬件产品。
以科大讯飞AI学习机T20系列为例,它在语数英等主学科进行了大模型应用落地,并上线了中英文作文类人批改、数学个性化精准学类人互动辅学、英语类人口语陪练功能。
科大讯飞学习机T20系列
就单拿这个中英作文类人批改来说,以往学习机批改中英文作文时,功能十分局限,只能进行语法纠错,词汇、句子润色,以及例句推荐等。
而接入大模型后,这款学习机可以“变身”为真人老师一样,首先就看学生是否达到了题目中的写作要求,以往的学习机并不能理解题目的含义,这就很容易造成写作跑题的问题出现。其次,学习机还会对学生文章的内容进行理解,并带着学生分析谋篇布局和行文表达等。
最后,以往的学习机更像是一个“打分者”,而搭载大模型后,学习机更像是一个“引导者”,它会带着一步一步带着学生找出自己文章中的问题,再不断训练写作思路。最后,以往学生使用学习机时总是困恼于“同类作文不会写怎么办?”现在有了大模型的加入,学习机可以实时生成推荐范文帮助学生积累写作素材,更好做到巩固完善。
中文作文类人批改功能
百度集团旗下智能科技品牌小度近期也推出搭载大模型的智能教育硬件产品——小度青禾学习手机。事实上,在小度之前,步步高、小霸王和海信都曾推出学习手机,但并未掀起太大的水花。
小度推出小度青禾学习手机
从官方发布的信息来看,这款智能手机搭载了小度AI学习大模型,可提供互动式AI讲题、多学科AI作业助手、AI口语练习等功能。这些功能和其他布局大模型落地教育的企业并未有太多不同。但小度下场造学习手机这件事却值得分析一下。
小度为什么看中了教育领域?很大一部分原因是,小度在教育赛道已经有了比较强的竞争力。根据市场研究机构IDC和Canalys的数据,小度学习平板取得2022年中国学习平板市场第一的成绩,这也就意味着,小度在这教育领域拥有一定的用户基础和差异化优势。
Omdia首席分析师李泽刚在接受媒体采访时称,百度的硬件可能还是基于自身的AI能力,只是以智能手机作为载体,同时,由于没有从供应链端听到百度造手机的消息,所以他预估百度手机硬件开发还是会寻求ODM(原始设计制造商)合作。
随着搭载大模型的智能教育设备已经陆续推出,可以看到无论是科大讯飞的学习机还是百度的小度青禾手机,相较于传统的智能教育硬件产品,他们借助生成式AI开始可以教学生如何思考,弥补了只能提供参考答案的不足。
更重要的是,目前市场上的智能教育硬件产品大多都是用硬件形态对原来教培内容进行装载,本质上仍然是这些企业在“卖课程”。但是大模型接入智能硬件后,这些智能教育硬件可以结合学生实际学习情况,为学生推荐适合的难度目标,真正做到了“千人千面”的定制化服务。
事实上,2021年,前腾讯教育副总裁陆昀在接受媒体采访时就已经指出,智能教育硬件的发展应该靠AI解决问题,而不应去靠“卖课”解决问题。只是那时并未有像ChatGPT这样的大模型涌现。
根据摩根士丹利行业数据,国内智能学习设备市场规模2023年预计达480亿元,同比2022年增长20%。那如何理解这个规模呢?以智能可穿戴市场为例,根据中商情报网数据,国内智能可穿戴市场规模2023年预计达934.7亿元,大约是智能学习设备市场的2倍,这足以可见当下智能硬件市场规模比较小。但为什么一些玩家还在加注呢?很大一部分原因是:教育行业市场空间大,家长付费意愿强,商业场景清晰。
虽然没有像在线教育平台一样的用户基础,也没有像互联网科技企业一样在大模型方面的优势,但是链式反应科技和悉之智能这样的AI初创企业在接入ChatGPT后,还在具体学科领域嵌入了私有数据集或者加入其他模型,这样就提高了解决具体学科问题的能力,因此也成为“大模型落地教育”过程中重要玩家。
学生时代,数学答案中一个“略”字可能会让不少人失望,悉之智能直接将纸质版的答案变成了二次元美少女AI家教。这家名叫悉之智能的公司原本就主攻自动解题,当看到ChatGPT问世,这就公司就将原有自动解题流程中的可计算语言模型(CLM)与大语言模型(LLM)连接,形成Joint Model模型,这样大语言模型提供NLP能力,CLM提供逻辑推理能力,从而使二次元美少女AI家教的讲解大大水平提高。
悉之智能推出的悉之AI家教App功能展示
可能有人好奇,这个二次元美女AI家教的形象、声音是如何做到的呢?这与前文所说的“接入大模型”有很大的关系,因为大语言模型不只提升了这款AI家教背后模型的NLP能力,还对多模态交互起到很大帮助。
除了在学科辅导上发力,爱喳猫还推出了兴趣天赋挖掘、时间管理以及情绪管理功能。爱喳猫的智能算法会根据学生个人机交互数据为学生生成学科知识画像、兴趣爱好画像与心理画像,并生成量化的分析汇总报告。
未来或许将会有更多的AI初创企业参与到大模型在教育领域的落地,届时会有更多的特色功能被开发出来,从而减少智能学习软件同质化严重的问题。
然而,在大模型火爆落地的教育的当下,在线教育平台、互联网企业、AI初创企业等三路玩家仍然面临着不同的问题和挑战。
对于在线教育平台来说,目前除了学而思计划推出自研大模型,其余像Quizlet、多邻国、可汗学院、高途等在线教育平台都是接入其他公司的通用大模型。然而通用大模型并非适配所有场景。
学而思CTO田密在抖音号就在提到:“一个大模型搞定一切的思路也许并不是最经济的解法,模型参数过大,训练和推理的成本都会数量级的提升。”他认为,一个通用大模型作为交互接口,然后用Toolformer(可以自学使用工具的语言模型)的思路,根据具体的任务,自动调用对应的领域模型获得结果,这种模型组合的方式性价比更高。
学而思CTO田密谈论通用大模型VS领域大模型
但要是让这些在线平台在短时间内推出具体场景下的自研大模型又不太现实,这些在线教育平台的杀手锏是优质的教学内容以及此前积累的用户群,但在AI大模型上比不上那些互联网科技企业拥有如此的技术积累。
而互联网科技企业可以靠着“自研大模型”、以及自身拥有的巨大用户群体躺赢教育赛道吗?仅仅将时间拉回两年前,彼时在教育赛道下注还有字节跳动。那时它宣布将原锤子科技团队组建的新石实验室并入Musical.ly原创始人阳陆育负责的智能教育硬件团队,合并后的硬件团队将聚焦于教育领域。
2021年9月,字节跳动大力教育旗下品牌瓜瓜龙就宣布上线智能写字板,3个月后,大力智能等累计销售突破100万台。好景不长,就在去年8月,字节跳动教育部门人士在接受采访时称,字节跳动业务裁员80%,裁员后团队规模变为1000人左右,大力教育智能硬件团队50%的人离开,且大力智能学习不再发布新品。很重要的一点就是字节跳动之前完全没有做过教育硬件方面的业务。
字节跳动旗下大力智能推出的大力智能学习灯
其次,目前智能教育硬件市场利润并不高,以在智能教育硬件市场“摸爬滚打”23年的读书郎为例,其在2022年的毛利率超过22%,但是净利润只有0.8%。这就意味着当下,打造智能教育硬件的企业们不能再仅仅聚焦于设备本身,而是应该把重心放到内容本身上。
大模型之所以受到这些科技企业的热捧,其中一个关键原因就是各家都迫切地想要利用AI形成新的内容生态,继而再同质化严重的智能硬件市场中搏杀出位。
目前来看,这些互联网企业在推动大模型落地教育的过程中,还需在智能教育硬件方面做好积累,同时要时刻保证内容板块的优质且贴合用户的真实诉求。
对于最后一类AI创企来说,它并不像在线教育平台和互联网科技企业一样拥有如此庞大的用户基础,而且本身在研发投入资金上也是一个难题。AI创业项目十分烧钱,从美国市场研究机构Trendforce的推算数据可以看到,处理ChatGPT的训练数据大约需要2万枚GPU芯片,随着OpenAI进一步展开和其他GPT模型的商业应用,其GPU需求量将突破3万张。而且,AI大模型目前还处于早期阶段,距离其商业化还需要很长时间,这就意味着这些AI创企在短时间内难以获得回报。
同时需要注意的是,AI大模型在教育领域的容错率更低,人大附中物理老师曾让ChatGPT解答2021年北京高考题目,结果显示,5道物理题答对3道,10道生物题答对6道,13道物理题答对8道,这就说明“智脑”目前远未达到百分之百的正确程度,这也将为入局的三路玩家提出更高的要求。
在生成式AI浪潮下,在线教育平台、互联网科技企业、AI初创公司等都在推动大模型在教育领域的落地。从在线教育平台推出的各种AI助手来看,大模型正推动以往的“AI家教”向”类人辅导“的方向发展;同时目前,接入大模型的智能教育硬件产品的交互能力也有所增强,从过去的”打分者“变成”引导者“的角色;最后,无论是悉之智能推出“二次元美女家教”还是爱喳猫推出的兴趣挖掘功能,都可以看出大模型也正推动教育向个性化方向发展。
但是,目前这三路玩家在推动大模型落地的过程中也面临着不同的问题,这还需要在线教育平台、互联网科技企业、AI创企等不断提升自身的技术储备、增强在教育内容方面的实力、不断推升大模型在解决实际问题中的正确率。
本文来自微信公众号“智东西”(ID:zhidxcom),作者:周炎 ,编辑:云鹏,36氪经授权发布。