编者按:本文来自微信公众号“智东西”(ID:zhidxcom),作者:心缘;36氪经授权转载。
最近半年来,苹果在AI领域连发大招。今年4月,苹果就被曝出挖走谷歌搜索技术和人工智能(AI)部门工程副总裁约翰·詹南德雷亚(John Gianandrea)。两周前,苹果正式发表声明,将Core ML和Siri团队合并为AI/ML团队,并由约翰担任机器学习和AI战略主管。如此大阵仗的举动背后,足见苹果已毫不遮掩其谋夺AI市场的雄心。
7年前,苹果率先引入Siri,抢下了AI的头柱香。然而,它却没能赶上接下来的深度学习大潮。待到谷歌、微软、Facebook等科技巨头竞相占据AI的领先地位时,苹果的影响力已经不可同日而语矣。
不过,苹果最近在AI领域的一系列大动作,似乎预示着它有心翻身超越,重夺AI高地。智东西仔细梳理了过去几年间苹果的AI战略布局,发现苹果已经在AI的硬件、软件、开发工具和应用生态方面不断发力,结合其在移动端和生态系统上的优势,布下了一盘AI大棋。
在2010年的某一天,Siri创始团队汤姆·格鲁伯(Tom Gruber)、达格 基特劳斯(Dag Kittlaus)和亚当·切耶尔(Adam Cheyer)在和乔布斯秘密谈话3小时后,Siri一整支24人团队全部被纳入苹果麾下。承载着乔布斯对语音控制一切的终极愿景,在AI还未掀起热浪的2011年,搭着iPhone 4s顺风车的Siri名噪一时。次日,乔布斯与世长辞,这似乎为Siri日后的发展笼罩上一层淡淡的阴影。
不得不承认的是,这些年来,Siri的光芒在消失。7年来,伴随着一系列调整和完善,Siri的成长速度却缓慢的令人失望。比Siri起步晚的谷歌Assistant、亚马逊Alexa陆续崛起,已然创造开放包容的语音服务生态王国。反观Siri,一直没有令人眼前一亮的新突破,鸡肋的“智能”有时还成了大家调侃AI还不成熟的一个笑料。
虽然苹果首款智能音箱HomePod从重量到音质、从降噪到远场语音识别都有着非常出色的性能,然而,住在它内部的Siri的表现还是有点“蠢”,HomePod也未能像苹果以往产品一样成为制霸市场。而市值紧随苹果之后的亚马逊和谷歌却风头正盛,根据场研究机构eMarketer数据显示,在2017年第一季度美国语音助手市场中,亚马逊智能音箱Echo占到70.6%的市场份额,谷歌Home占23.8%,苹果则和其他厂商一起瓜分余下的5.6%。
不过,苹果显然仍对Siri充满信心。在2016年全球开发者大会上,苹果公布Siri通过机器算法生成的更加人性化的新声音,并打破封闭生态,发布允许第三方公司和Siri继承的开发工具SiriKit。今年苹果宣布在Siri和App之间构建Shortcut,打通语音控制的用户使用体验。除了支持第三方应用,升级版Siri也实现了支持英译汉、西、意、法、德的实时翻译和更精准的预测,并能基于用户兴趣推荐新闻,并能完成帮用户回复消息、订票以及在日历上添加事件等功能。
或许谷歌前AI主管的加盟以及Siri和机器学习的组合拳,能帮Siri逆风翻盘。
如果说Siri和机器学习的结合还没有让人感受到明显的变化,那么AI芯片的推出则是给了果粉一颗定心丸。
在iPhone封闭生态链的建设过程中,芯片开发绝对是不可或缺的重要组成部分。在去年苹果发布会上,苹果推出重磅新品iPhone X,这部iPhone十周年纪念之作、第一款全面屏旗舰手机iPhone,成为为苹果第一季度带来380亿美元收入的主力军。在全球智能手机市场普遍萎缩的情况下,iPhone X凭什么逆势畅销?这就不得不提到装备了A11仿生芯片和结构光两大王牌。
一个专用于神经网络计算的硬件模块——“神经网络引擎(neural engine)”联合“图形引擎(Graphics Engine)”成就最强移动端AI仿生芯片A11 Bionic。A11 Bionic采用双核设计,拥有四个高效内核和一个苹果自主设计的GPU,能以每秒6000亿次的速度处理机器学习任务。苹果的面部识别、AR物体侦测、Animoji脸部追踪等任务都依赖于AI芯片。它不仅是iPhone有史以来最强大最智能的芯片,也是世界上首批终端AI芯片。移动AI芯片的落地,已经开启全新的技术应用场景。
随着新一代开发者大会的临近,A12处理器的跑分已经曝光。据传,A12在GeekBench中的跑分为单核5200、多核13000左右,比A11的单核性能大致提升24%、多核性能提升40%。根据产业链信息,A12有可能采用台积电7nm FinFET工艺,全新的7nm工艺芯片面积降低40%,性能提升20%,功耗可下降50%,再加上架构的改进和更多核心,届时性能很可能暴增。不过A12大核功耗问题仍然存在,苹果正着力解决,具体的核心数和架构信息也暂无消息。
被一众用户吐槽有点丑的“齐刘海”,则藏着iPhone X的另一大杀器——结构光模组,苹果去年重磅推出的可瞬间解锁和移动支付的Face ID正是基于此而实现。结构光模组是一整套原深感摄像头系统,内部集成了六七个传感器。在使用Face ID解锁时,点阵投影器会投射出高达30000多个肉眼看不见的光点投影到用户脸上,感应获取人脸各部分形变数据,完成实时3D建模,并且识别不受眼镜、发型的影响。结构光模组发挥了普通摄像头无法匹敌的出色视觉效果,其脸部追踪技术还实现了Animoji动画表情和和人像光效等全新功能。
苹果善于提供新技术来吸引高端消费,或许你觉得没那么重要的3D Touch、Face ID、双摄人像等模式,却在行业内引领一轮又一轮新的风潮。自苹果iPhone X搭载3D结构光模组以来, 全球3D结构光供应链日趋完善, VCSEL 供应商 Lumentum、Finisar、AMS、IQS、全新光电以及台湾晶圆代工厂稳懋、晶电等均纷纷布局 3D结构光领域。
在苹果iPhone X问世近1年后,OPPO、小米才分别公布采用3D结构光方案的OPPO FIND X、小米8探索版,同样,华为预计在下半年相关机型也将搭载3D结构光,这些国内各手机品牌的陆续跟进,说明了苹果在智能手机的创新布局上保持前瞻性。不过据传苹果与关键元件VCSEL供应商Lumentum签有协议,在专利保护之下,3D 结构光在安卓手机的大规模普及可能要等到明年。这也说明了继产业链之后,安卓阵营在技术创新上的落后使其仍在持续追逐苹果的脚步,iPhone在智能手机的领先地位和AI领域的突破性成就都很难在短时间内被撼动。
在发力AI芯片的同时,苹果还向用户开放了移动端 AI开发的大门,Core ML和Create ML就是苹果AI开发者准备的究极开发工具。Core ML让开发者更方便的训练机器学习模型并封装进App,而Create ML的最特别之处在于实现了在移动设备上的AI计算。
Core ML是苹果在WWDC 2017推出的新型机器学习框架,主要支持图像分类和文本信息处理两个模块,开发者可以把机器学习模型封装到App中。第一代Core ML存在支持第三方框架少、尺寸过大且不能定制化等问题,针对这些缺陷,苹果在今年的WWDC开发者大会上推出更小更快的2.0版本,同时对模型大小和运行速度进行了相应优化。其配套工具 Core ML Tools 也增加了可支持的第三方机器学习框架,并新增了可以批量预测的API,开发者可以借助工具定制化工具自定义神经网络层和Core ML 模型。苹果提供了从流行框架模型到其定义的标准模式格式的转换工具,可以使用各个模型的训练阶段,还把Swift代码都生成好了,方便人们进行开发工作。
Create ML框架则可以直接从数据上生成Core ML模型,极大程度上解决了模型获取方面的局限。Create ML是在WWDC 2018推出的对本地AI应用进行机器学习训练的工具,支持GPU加速,支持任务主要包含计算机视觉、自然语言处理和标注信息预测的一般模型。通常AI训练过程会非常消耗CPU资源和存储空间,而且由于云端服务器有更强计算能力,这个过程往往在云端进行,一旦断网就不能继续进行了。而Create ML打破联网的限制,不仅能实现本地AI训练,还为用户提供将AI模型嵌入App的快速工具,给了每个人自主开发AI应用的便利条件。
这两款工具都承袭了苹果强调保护用户隐私的一贯态度。所有数据都存储在手机上,相关计算也都在本地完成,有助于降低数据泄露的风险。
和谷歌、亚马逊、微软不同,苹果的最大特点在专注于完全适配自家软硬件设备的“闭环式”完整生态系统。
苹果已经连续七年稳坐市值第一的宝座,其快速增长的软件与服务业务绝对功不可没。苹果在7月6日发表声明,称苹果用户已破十亿,向开发者分成超过1000亿美元。根据上周二应用分析公司Sensor Tower发布的上半年全球应用收入统计数据,App Store的用户支出大约为226亿美元,几乎是118亿美元的Google Play商店用户支出金额的两倍。
从2010年开始,苹果就开始大手笔收购AI初创公司,范围涵盖了半导体制造、机器学习、语音识别、面部识别、表情追踪等等。尽管苹果每收购一个AI公司,均不会对外公布收购目的和发展计划,但如今其中一些初创公司的潜力已经渐渐显露,正在帮助苹果打造更广泛的AI应用场景。
苹果在AI硬件、软件和平台的频频发力,仅仅是苹果庞大AI布局的开端。苹果每个产品的推出都严密整合了大量的内部资源,它循序渐进地开发新品,并将技术统筹到一个核心思维之下,使苹果的软硬件产品在用户体验上具有毫无割裂感的巨大优势。无论创新程度几何,只要在产品质量和性价比上没有重大失误,苹果强大的整体用户粘性都使它很难“凉凉”。苹果的垂直整合策略,已经为其构建了稳定的应用生态帝国,而苹果就是这个帝国的唯一“独裁者”,掌握所有App的生杀大权。
苹果开放AI平台和计算能力,竭尽全力降低进入App生态圈的开发门槛,其四大生态系统iOS、MacOS、TVOS和WatchOS都开始围绕AI进行相关布局,为AI生态的全面展开做好充分准备。根据苹果官方说法,苹果iOS 11系统提供了数百项升级,机器学习已经广泛应用在照片图像识别、Apple music听歌推荐、iPhone电池续航等产品和服务中。iOS应用开发者如果想要与时俱进并吸引更多苹果用户,使用苹果提供的AI开发工具和架构、做AI方面的创新应用将是大势所趋。
没人能否认,苹果是一家非常成功的公司。十年前,苹果的颠覆式创新引发了整个智能手机行业的变革。七年前,Siri第一次将AI的概念带入消费者的口袋。在乔布斯之后,苹果产品虽然不复曾经的惊艳,但它在已经形成的强大生态链上稳步创新,依然是行业的领航者。库克曾暗示AI和AR将是苹果未来两大核心支柱。不过AI并不在苹果的DNA中,选择AI其实在一定程度上迫使苹果远离了自己的硬件和服务的舒适区。
▲谷歌、苹果、Facebook、英特尔在AI领域的收购战
对于硅谷巨头来说,AI的竞争无非就是资金、数据和人才的竞争。尽管苹果拥有雄厚的营收和现金储备,但数据和人才却给苹果带来一定压力。
众所周知,对于AI而言,得数据者得天下。谷歌和Facebook都在AI竞争中早早开始大量的数据挖掘,但是这与苹果绝不侵犯用户隐私的定位相悖。尽管苹果关于隐私的承诺让大多数消费者感到心安,但在数据为王的时代,对隐私的保护必然会在一定程度上限制AI的发展,而让竞争对手长期领先可不是上策。
此外,苹果的“秘而不宣”的一贯作风,和其他科技巨头的自由开放相比,让很多人开始质疑苹果是否在AI领域底气不足。在AI人才储备战中,大量的AI大牛加盟竞争对手的团队,就连苹果AI芯片设计的灵魂人物约翰·布鲁诺也在去年被谷歌撬走。不过苹果已经改变态度,加大对AI的宣传力度,允许旗下研究人员发表研究论文,并加入一个由谷歌、亚马逊、微软、Facebook和IBM联合创办的AI道德研究联盟(Ethical AI researchconsortium)。从挖走谷歌AI猛将约翰·詹南德雷亚来看,苹果在补上人才缺口方面可以说是初见成效。不过,苹果要想在吸引顶尖人才和保持自身神秘感之间寻找一个平衡点,还是存在比较大的难度。
在AI时代,苹果的脚步的确慢了,不过现在仍处于AI早期阶段,苹果还有足够的时间去迎头赶上。iPhone十年之后,重组AI阵营的苹果能再次颠覆整个行业吗?我们可以一起期待。