编者按:几周前,Learning VC的Louis Coppey发表了一篇文章,概述了人工智能创业公司如何创建护城河的思考框架。最近,通过与几个读者的交流,Louis Coppey又发表了一篇文章,对之前的框架进行了补充。文章由36氪编译。
几周前,我发表了一篇文章,概述了人工智能创业公司如何创建护城河的思考框架,提出了一个公式,即在人工智能领域的成功=数据*数据+ML人才+算法。反馈循环下图所示:
数据是核心,有了数据能够吸引人才。人才与数据结合,能够训练出精确度比较高的算法模型,从而能够形成数据网络效应,并获得大量的客户。客户的增加,又能进一步丰富数据......
文章发布后,获得了广泛的关注,并引发了几位人工智能从业者(创始人、产品经理、风险投资人)的讨论。我认为这些讨论给我之前提出的框架提供了有趣的补充,在这篇文章中,我将会把其中的3点分享给大家。希望这些能够给大家带来一些的启发,尤其是看过我之前文章的。如果你之前没有看过,传送门在此(文章由36氪编译)。
罗布•梅(Rob May)是总部位于波士顿的人工智能创业公司Talla的首席执行官。他还是一份名为InsideAI的时事通讯编辑。以下是他的观点:
文章谈到了相关产品在人工智能领域的竞争优势,而这正是大多数分析所关注的。能够访问专有数据的产品表现更好,从而能够获得更多的客户和更多的数据。这个结论是准确的,但基于我在人工智能市场迄今所看到的情况,我想在此基础上增加一层,并提出一种更复杂的关系。
我认为,搞清楚如何销售人工智能服务可能会形成一种早期的、暂时的优势,这可以让一家公司长时间内处于非常有利的地位。
据我所知,大多数销售人工智能服务的公司实际上都在努力做到这一点,原因有以下几点。首先,要开发一个只做一件小事的人工智能系统,可能需要做很多工作。大多数人工智能产品的训练都是在一个数据集和一个模型上进行的。如果你考虑一下它们该如何应用到商业世界就能知道,它们往往是小众产品,而不是一个功能齐全的产品。因此,你必须找到一些有针对性的用例,让后利用相应类型的数据把人工智能训练得有用。因为在许多用例中,你需要利用多个数据集以及工作函数对人工智能进行训练,才能使其变得有用,并达到能够销售的标准。
第二个问题是,部署,尤其是获取客户数据来培训模型(如果你需要的话)可能会减缓销售周期。我看到大多数人工智能公司都在做有偿的试验,这在软件即服务(SaaS)的早期阶段并不多见。但是,客户担心的是如何实现人工智能,以及它的工作效果如何。
第三个问题是,客户不理解许多人工智能系统中的概率特性,以及如何将它们整合到自己的工作流程中。如果使用SaaS系统,当你点击按钮“X”时,100%会执行动作X。对于人工智能,你可能会得到一个估算的结果——比如96%。这是什么意思?有4%的概率会出错吗?如果是这样,你怎么知道什么时候该忽略这台机器呢?更重要的是,因为人工智能承担的通常不是某个人的工作。那么,在你的公司里,谁应该为这个问题负责?
在我看来,考虑到目前的创业生态系统状况,如何大规模销售人工智能仍然是一项挑战。作为一个创业公司来解决这个问题,可能会让你在数据获取和市场感知方面占据优势,即使你刚开始的时候没有大量的数据,也没有有最好的算法。这是一个很好的起点。
我认为这是一个很好的观点。我同意这样一个事实:如果能够想客户销售一款简单的产品,来获得一个初始数据集,对于人工智能创业公司进一步扩大规模来说,绝对是一个关键。我认为,一个较好的方式是在市场中建立一个与数据网络效应并行的平台。从理论上讲,在市场形成的早期拥有一支非常优秀的运营团队,并不能说是一个长期的竞争优势。但它有助于发挥市场的网络效应。相比之下,数据网络效应更是一个人工智能创业公司进入市场的壁垒。但在早期,它的确提供了关键的竞争优势。基于此,我对最初的图表进行了补充:
瓦伦(Varun)是第一批在我之前文章下面写评论的读者之一。以下是他的评论:
你好,路易斯( Louis),这是一篇精彩的文章,但是你如何看待AlphaGo Zero与强化学习(Reinforcement Learning)之间的关系呢?它从头开始学习,并击败了之前版本的Alpha Go(基于监督学习/从数据中学习)。不好意思,我在这里刺激你,但希望在后续的文章中,强化学习会是一个能够改变游戏规则影响因素,而“数据护城河”和数据网络的影响,也将在不久的将来无法与强化学习驱动系统相匹配。
这是一个很好的点!以下是我的看法:
对于那些不太清楚这个话题的读者来说,可以看一下Deepmind在自然杂志上发表的论文(传送门),介绍了AlphaGo的新版本以及它的算法学习如何玩围棋的。AlphaGo Zero算法的新颖之处在于它使用了强化学习(RL)。这种算法的一个特点是,它可以独立学习,不需要任何初始数据集。在(非常)短的时间内,该算法试图根据计算概率在任意给定的时间内,来找到最佳的移动操作。在经过更少的迭代和使用更少的计算能力之后,AlphaGo Zero的表现胜过了它之前的使用监督学习的版本。随后,一些行业观察人士开始将AlphaGo与“人工智能领域最重要的研究进展”等联系在一起。为什么?
因为这个新版本不需要初始数据集,就能超越那些经过多年数据训练的系统。
Deepmind的论文中,AlphaGo与之前版本的 AlphGo的性能对比
从这个角度来说,我之前提出的方程式:
在人工智能领域成功=数据(*数据)+ML人才+算法
从根本上来说,是错误的。
不过,在我看来,这个说法是不对的。只有当我们处在一种情况下,即所有的可能性都可以被问题的定义所限制,我们才能计算出在任意给定的时间内获胜的概率与可能性。
围棋是这样的一种情况,但在现实世界中,绝大部分情况都并非如此。
以预测销售数据为例。不管销售人员采取什么行动,世界就会发生变化。我们无法在现有的模型中增加给定行为的所有可能结果。或者说给出的可能性是非常片面的,因为还有很多隐藏的变量。
在人工智能领域,AlphaGo Zero是一个惊人的突破,但我仍在想,它该如何应用到工业设备中去。
我所知的强化学习是在奖励机制的基础上,利用历史数据来训练一个ML模型,来了解每个变量对预测影响。但这仍然需要历史数据。
阿比谢克(Abishek)是一名产品经理,目前就职于专注计算机视觉的创业公司Clarifai,该公司已从USV等领先的风投公司融资4000万美元。
下面是他的一个问题:
ML可以用于许多不同的应用程序,比如推荐引擎、计算机视觉、自然语言处理等等。如果一家公司(非技术/大数据)发现了以上的应用程序,但这并不在它的业务范围内,这家公司是否应该去进一步投入资源,完善这个应用程序,使其算法的准确率达到80%以上,并能够交付到市场上吗?
这是一个非常有趣的问题,但我没有答案。我的想法如下:
如果这是核心业务,那么公司进一步开发并且完善的可能性就很高。我在之前文章中提到的高速公路公司就是一个很好的例子,它试图利用计算机视觉技术来检测卡车的尺寸,然后进行收费。很显然,收款是该公司的核心业务。与一个刚刚进入该领域的创业公司相比,它有很多的初始数据,而且有更多的通用ML API(比如Clarifai)能够使用。对该公司来说,建立一个准确率达到80%以上的算法可能不会太困难。
如果不是核心业务,我认为创业公司更有可能胜出,因为启动这样一个项目的投资回报率可能不会很好。比如,房地产门户网站或社交媒体的照片审核就是一个很好的例子。
此外,我还看到了一个有趣的问题:“公司是该购买一个95%准确率的解决方案,还是自己建立一个准确率达到80%的解决方案?”
对此,我同样给不出具体的结论,我想这很大程度上取决于企业的内部问题的规模。
相关文章:如何让你的 AI 创业公司有竞争力?这有一个“成功方程式”
原文链接:https://machinelearnings.co/part-ii-routes-to-defensibility-for-your-ai-startups-acdb141e38ce
编译组出品。编辑:郝鹏程