编者按:本文来自微信公众号“Tech星球”(ID:tech618),作者:周晓奇,36氪经授权发布。
“如果大家要找一棵大树,都会想到去森林里面找,人工智能也一样,其中细分场景和细分应用非常多,我们要拥抱开放的生态,这是最关键的创新驱动力”,商汤科技联合创始人、CEO徐立说。
7月10日,在全球人工智能大会商汤企业论坛上,徐立在演讲中宣布OpenMMLab战略升级,成立由商汤科技发起的“人工智能算法开放体系”。
战略升级后,OpenMMLab人工智能算法开放体系将涉及超过10种研究方向,覆盖超过100+算法和600个预训练模型。
“OpenMMLab是由我发起的一个计划,参与人员有我一部分的学生和商汤的研究员,后来逐渐演变成整个商汤人工智能开放的体系,目前我会统筹这个开源体系的未来发展规划”,商汤联合创始人、香港中文大学信息工程系教授林达华说。
2018年,香港中文大学与商汤科技联合实验室(MMLab,MM代表多媒体)启动OpenMMLab计划,过去两年内,MMLab逐步开放了多个开源算法库和工具箱,并获得越来越多AI研究人员的使用和回馈。
“尽管我们的算法面向公众、学术界和产业界,但开源算法不是针对一些特定的落地场景需求去开发的,任何一个具体的场景都有独特的需求,企业需要懂得如何将产业需求与算法结合起来”,林达华说。
作为一家技术驱动型企业,商汤不但要解决技术上的难题,而且也需要接受产业落地的挑战。为此,对商汤而言,成体系的算法框架平台,不仅能够提高开发人员想法落实的效率,还能够提升整体生产力。
如今,经过多年发展的人工智能,已经应用在安防、教育、旅游、娱乐等领域,接下来AI模型应用到更多关键领域时,如何提高决策可靠性,也成为今后面临的重要挑战。
不可否认,目前人工智能在技术上已经达到非常高的水平,但背后仍旧需要海量数据与巨大的算力。
商汤联合创始人林达华
今后,AI如何更好地应用到产业?在此其中,商汤会重点布局哪些方面?在开源算法日益增多的情况下,AI企业如何提升自己的竞争力?近日,Tech星球(微信ID:tech168)专访了林达华,以下为对话实录:
Tech星球:OpenMMLab人工智能开放体系在商汤内部是一个什么样的地位?OpenMMLab有哪些价值?
林达华:OpenMMLab是商汤人工智能算法开放的一个体系,也是商汤拥抱开源开放非常重要的战略性一步,其最重要的意义是与整个AI产学界开源体系的连接。
AI算法研发的过程是非常复杂的,从一个简单的想法到最后落地,其中需要非常多的步骤,在算法开发层面需要很多工程化方面的实现,这些都需要花费大量实践和工程资源。
OpenMMLab的价值在于,可以基于其提供的框架顺势形成落地技术,加快研发的流程。
Tech星球:在什么时候决定将OpenMMLab定义为人工智能开放体系?当时做出这个决定的契机是什么?
林达华:首先OpenMMLab在两年前就逐步开源了一小部分代码库,当时我们知道学术界在实现一些算法的时候存在很大的困难,后来在算法实现过程中,我们发现缺乏统一的、具备良好结构的代码库 ,对目前产研界是一个非常巨大的痛点。为此从今年初,我们开始做准备,在当下将OpenMMLab定义为人工智能开放体系。
.
Tech星球:目前OpenMMLab聚焦在十个研究方向,选择这十个研究方向是有经过怎样的考量呢?
林达华:我们在方向上的选择,主要还是看学术界和产业界最普遍需求的是哪些方向,以及商汤有比较多算法积累的方向。具体这十个方向有图像分类、图像检测、语义分割、动作识别等,这些是计算机视觉领域最主要的方向,也是实际运用中最广泛推动的一些方向。
Tech星球:你觉得OpenMMLab的开源,对开发者本身工作有什么帮助?能给他们带来什么?
林达华:一句话总结,就是他们从想法到实现的路径大大缩短了。以前没有这些开源代码库支撑的时候,他们实现一个算法,需要经历非常多工程上的支撑和实践。现在有了这样的代码库,有了很多架构的支持,对于一个有新想法的研发人员来说,他只需要把创新的部分实现出来,其他的部分可以依托开源代码库实现。
比如实现一个物体检测的算法,从看到论文到实现算法,并且把精度调整到论文的水平,可能需要花上两三个月的时间,现在从想法到落地,只需要几天的时间。
Tech星球:OpenMMLab对技术转化为生产力的过程中,有哪些具体帮助?
林达华:我们之前接了一个项目,客户要求在一两个月时间内,交付60多个模型。当时我们有十几人在这个项目上,要在短时间内要交付这么多模型,而且性能等方面还需要达到一定的水平。
通过OpenMMLab的支持,以及商汤其他模型基础,我们每天都可以交付几个模型,而且能够保持一定的水准,这种算法框架和平台对提升商汤整体生产力的作用很大。基本上有和没有这个平台,相差非常大。
Tech星球:你觉得目前商汤在从技术到产业落地的过程中,商汤会遇到哪些挑战?
林达华:两个方面,一个是技术层面,一个是落地层面。我们发现技术向各个行业落地的时候,会有不同形态上的演变。比如以检测为例,我们在街上检测人脸、在工厂场景下检测零部件、在医疗图像中检测病理特征,本质上这些都是检测,但同样的算法在不同场景落地,会演化出非常多不太一样的版本,这会给技术积累产生很大的挑战。
人工智能检测道路上的物体,图源自商汤
其次,在落地层面,我们要深入地理解每个场景的需求和痛点。当我们没深入某个行业的时候,会对这个行业有自己的想象,但深入之后会发现其实是另一番风景,这对从技术背景成长的同事是一大挑战,这也就要求我们既需要懂技术,也需要懂行业。
Tech星球:从基础研究到商业化落地,商汤如何协调这两者之间的关系?
林达华:两者并不是相互矛盾的事情,其实是相辅相成的。首先,商汤在研究过程中,也会从开源项目中吸取内容,因为里面各种参数都调好了,这样实现路径就会变得非常短。
同时,商汤在研发过程中也会产生大量算法,我们会将这些成果贡献到开源项目中,这样一方面缩短我们研发的速度,也会加快商业化落地的步伐。
Tech星球:现在有些看法表示,相对成熟的开源算法加上实践过程中硬件条件、外部施工等方面的影响,最终大家体现的效果不会相差很多,这可能不利于拥有真正先进技术的AI企业,对此你怎么看?
林达华:首先,如果一家企业的独门算法或技术的效果与开源算法差不多,那这家企业需要问自己的主要价值在什么地方,每个企业一定要寻求自身独特的价值。
其次,做开源是面向社区、学术界和产业界,这些开源算法不是针对特定的落地场景需求去开发的,我们会发现任何一个具体的场景都有自己独特的需求,这不是一个开源算法拿过去就能解决的。
企业要有捕捉独特需求的能力,这也是核心竞争力的一部分,之后要懂得怎么把产业需求和算法结合在一起,实际上开源算法能够更快地将想法实现的过程缩短,让企业发挥竞争力。
如果一个企业因为算法的开源发现自己的技术丧失了竞争力,那我觉得他应该要去好好思考自己工作的定位。
Tech星球:去年底,你提到CV(计算机视觉)才刚刚开始,你觉得今年CV厂商将处于一个怎样的情况,在这个阶段商汤会重点布局哪些方向?
林达华:如果类比一个人的成长,他是有百年的历程,现在我们刚刚才做了几年,所以也刚刚进入少年期。
原本在2010年之前更多是学术界的事情,后来商汤等公司出来后,CV(计算机视觉)处于产业化落地时期,今后随着更多人的加入,CV会从某些重要领域的工业化,逐渐走向全社会普及化的阶段。
不过,虽然我们看到CV行业的领域在不断扩展,但同时也在面临更大的挑战。我们可以看到经过这些年的发展,在技术、工程上已经有了非常高的水平,但也会看到其依赖巨大的算力,依赖大量数据,这样在场景落地上会面临比较高的代价。
同时,AI与更多领域结合的时候,如何克服新的挑战。比如AI应用到医疗、自动驾驶等关键领域,我们如何提高AI在决策时的可靠性,这些都是未来面临的重要挑战。
Tech星球:你如何看待现在整个人工智能开源的现状?对未来有哪些看法?
林达华:目前人工智能领域的开源,还处在起步和百花齐放的阶段。我们可以看到Facebook、Google等公司在开源开放方面的努力,但更多是单点、单一方面想的开源,未来整个领域会从单篇论文、单个方向的开源,逐步走向开源体系,最终形成非常蓬勃的体系,这样会减少科研实现路径与付出的代价,以及加快业界落地的速度。