百模大战现状:阿里、实在等杭州“八仙”过海,显国产“大模型”神通
在过去一段时间里,AI大模型的规模不断增长。据不完全统计显示,全国已经出现了106个大模型,还有在内测、未开放给公众的大模型正在道路上。在地域上,北京、上海、深圳、广州、杭州、成都等城市齐发力,大模型发展处于混沌初开时刻。
而杭州目前的大模型就有8个,包括阿里云的通义大模型家族,西湖心辰的西湖、宇视科技的梧桐、恒生电子的Light-GPT、蚂蚁集团的贞仪、新华三H3C的百业灵犀、实在智能的塔斯、网易伏羲的玉言,这都为努力打造全国算力成本洼地、模型输出源地、数据共享高地,全力建设数智新城的杭州,带来了一大波新动能。
从数量上看,目前,杭州地区阿里巴巴旗下阿里云通义大模型家族已经有通义千问和通义万相(AI绘画创作大模型),且今年4月11日的阿里云峰会上,阿里云表示阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等。
作为大语言模型,通义千问与ChatGPT类似,它支持多轮交互及复杂指令理解、多模态融合以及外部增强API,能够实现多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能。落地到阿里深耕的电商领域,最直接的用法便是智能客服。对于平台来说,大模型可以用在智能推荐方面,平台利用大模型的人工智能算法可以实现海量数据集的深度学习,分析消费者的行为,并且预测哪些产品可能会吸引消费者,从而为他们推荐商品。反之,对于消费者也亦如此。使用大模型后,消费者可以将大模型当作“导购员”,可以详细叙述自己的用途需求,以达到消费目的。此外,阿里巴巴旗下的蚂蚁集团也透露出了贞仪大模型的自研计划,也跑在了杭州地区的前列。
在大厂群雄逐鹿之时,一家位于西湖边的企业迅速突起,凭借顶流的技术团队和差异化的大模型路线,获得了众多资本青睐。西湖心辰研发首个可自助联网的多模态大模型——西湖大模型。 西湖大模型是一个结合了文本、图片、语音、视觉、多模态能力的大模型,模态之间会深度融合,模型能从多种模态中共同获得信息进行更深度的推理,在长期记忆能力的支持下,可以展现出很类似人类的交互沟通能力。
例如,在秉持“以人为导向,更像人,更懂人心”的技术研发理念,西湖大模型致力于解决大模型无法很好理解人类意图,无法与人类建立深层情感链接的问题,其拥有更高的情商,具备长期记忆、个性化和情感感知等特色,能够记住用户的历史互动信息,深度定制模型的人设、性格和偏好,并且能感知用户的情绪状态,采用更有温度的表达方式和用户互动。
AI赛道上的狂飙,仍不乏新锐科技公司,他们在大语言模型的研发和应用当中也在积极探索和发展,大展拳脚,并取得了瞩目的成绩。距离阿里不远的中国人工智能小镇,这块杭州AI科技宝地上接连传来自研大模型的捷报——位于小镇1号楼7楼,实在智能在上半年收官之际推出了自研垂直大模型TARS(塔斯),成为了杭州地区大模型的又一新星。
据了解,实在TARS大模型基于开源基座模型,在千亿级高质量Tokens上进行了充分训练,历经半年研发,近期正式进入内测。从成果展示上看,TARS大模型解锁了名词科普、语言翻译、上下文阅读理解、写代码及文章等“技能”,将提供前所未有的交互式语言处理能力。特别地,实在智能在充分落实国家互联网信息办公室发布的“关于《生成式人工智能服务管理办法(征求意见稿)》”基础上,在TARS大模型中叠加了多项自然语言处理前沿技术,如:模型的不当言论判别,从而进一步增强了模型的生成效果和安全性,并全面支持私有化部署,用户可完全自主掌控数据和模型,根据业务需求进行定制化开发,确保内部敏感数据的安全性。
大模型的火热也吸引着浙江日报、杭州日报等官媒的关注。实在智能创始人、CEO孙林君在接受采访时表示,企业的产品全都可以用“大语言模型”全面升级一遍——目前,实在智能TARS大模型聚焦推动公司旗下的RPA产品与之深度融合,让实在智能的数字员工具备了更强的AI能力。
每个模型都有着独特的优势和特点,代表了杭州人工智能产业的多样性和创新力量。“百模大战”的背后,是一场声势浩大的技术革命。从技术角度来看,这些大模型都基于最先进的深度学习和自然语言处理技术。它们通过大数据的训练和迭代优化,具备了强大的智能化能力,能够处理复杂的问题,并做出准确的预测和决策。同时,它们还在不断地与其他领域的技术进行交叉和融合,探索更多的应用场景和创新可能性,为用户带来实际的价值和应用结果。
作为人工智能产业的一部分,在杭州这样一个具有创新氛围和科技优势的城市,这8家公司的大模型必将继续发挥重要作用。通过技术的突破和不断创新,他们将不断提升人工智能在各个领域的应用水平,为社会带来更多的智能化解决方案,推动人工智能的发展步伐。