首页 >热门资讯> 在线作图 > 驰星创投孙劲超:智能交互是AI投资的黄金赛道,存在5个机会 >

驰星创投孙劲超:智能交互是AI投资的黄金赛道,存在5个机会

转载时间:2022.01.07(原文发布时间:2018.04.02)
194
转载作者:36氪企服点评小编
阅读次数:194次

在中国投资界,有很大一部分投资人不具备理工科背景,这是否会影响他们对高新技术项目的判断呢?尤其是面对当前火热的AI项目,“不懂技术”往往被看做投资人的劣势。然而,有一位投资人提出了他与众不同的看法:投资人的优势在于观察市场,不懂技术不可怕,从场景倒推技术同样可以发现很多机遇。

本篇实录系根据健一会沙龙第219位主讲人孙劲超在健一会主办的“2018年 AI 泡沫面临破裂吗?”主题沙龙上的精彩分享整理而成,原标题为《智能交互行业的发展趋势与投资机会》,现标题为健一君所加。

根据嘉宾意见,分享内容已删去部分敏感观点及内部信息。

驰星创投孙劲超:智能交互是AI投资的黄金赛道,存在5个机会

■ 孙劲超

驰星创投 投资副总裁

金融学硕士,交通大学安泰经济与管理学院MBA。曾就职于招商证券从事资产管理和投资银行工作。2017年加入思必驰产业基金,任驰星创投投资副总裁,负责人工智能,金融科技领域的投资和研究。投资案例包括:RT-THREAD物联网实时操作系统,思既美(上海)智能科技有限公司,北京增强智能科技有限公司(AITEK)等人工智能初创企业。

分享:孙劲超

整理:尹 扬

审核:阮聿泓

大家好,我是孙劲超。首先介绍一下我所在的机构驰星创投(AISTAR FUND),公司成立于2017年,是一家专注于早期人工智能领域投资的VC机构。同时也是思必驰的产业基金,协助思必驰进行生态布局。我们最大的特色在于可以为被投企业进行赋能与孵化。想必大家对思必驰都很熟悉,它是一家以算法为核心的专注于人性化智能语音交互技术的企业,成立于2007年,是AI领域的老兵。

今天我主要从微观技术和投资趋势两个方面对智能交互技术进行介绍。

从场景反推技术是更稳健的AI考察方法

首先和大家分享两个观点。

1、算力比算法更重要。

AlphaGo与人类的围棋对决,让人工智能产业受到广泛关注。算法和算力都是人工智能底层架构中最重要的部分,而在本次浪潮中,我认为算力比算法更重要。以前实现某个功能可能需要100台电脑,但现在只需要1台,这意味着整个算力呈指数级上涨之后,原本复杂的算法能够在C端用户场景中得以使用。

2、从赋能角度看技术。

现阶段大家习惯用“分层法”去观察一个产业,比如从最底层开始,先后观察技术层、认知层、感知层及应用场景。“分层法”会导致一个困扰:许多投资人不具备理工科背景,如果对产业采取从下往上的认知方式,首先接触技术层,并以此作为参考依据,难度比较大。其实各位投资人都有自己熟悉的行业和赛道,不妨从场景来反推技术,从赋能角度观察技术给相应场景带来的价值,这种方式更容易被大家接受。

对于AI行业,可能大家心里都有一个疑问:是不是一定要看懂项目才能投这个行业?对于早期项目来说,技术的确是非常重要的一环,而且要搭建个人资源网络,在各个顶级名校和BAT中里寻找大牛。随着投资轮次的不断向后延伸,项目的商业路径、趋势、愿景逐渐明朗,这些对投资人来说会变得更为重要。

不过,即便在早期项目中,技术指标也并不是最重要的观察对象。以语音识别为例,80%的识别率和90%的识别率是有区别的,其区别在于:机器是否能够听懂人类的语言;而97%的识别率和97.5%的识别率区别并不大。

因此,在观察涉及到人脸识别、计算机视觉、自然语言处理和理解等各类技术的早期项目时,技术指标是应该关注的重要内容之一,但不应作为关键点,关键点应该被放在技术所应用的场景上。投资人对场景的垂直认识度比在技术端创业的企业家更深。此时投资人的价值在于从细分赛道上对技术进行赋能。从早期的天使到中后期轮次的投资,其内在逻辑和收益考量都是不同的。因此,早期投资人帮创业者规划的路径非常重要,因为具备技术实力的企业非常多。思必驰在智能语音交互领域研究了十年之久,很值得尊敬,但其商业爆发期依靠的仍是解决方案对场景的助力。所以,投资人对企业的赋能非常重要。

智能交互会朝着自然人机交互方向发展

智能交互正在经历一个从感知智能到认知智能的过程,从早期计算机硬件端的储存,到感知人类的听、看、闻、说、行为等,机器正在向认知智能发展。

现在大家把大数据作为AI底层的重要技术来看待,但是如果将来AI想要突破现有格局或者实现爆发性的二次增长,大数据不会是唯一的答案。真正意义上的人工智能应该是对陌生环境的认知能力,而不是对历史的学习能力。所以机器学习算法虽然已诞生许久,直到算力实现指数级爆发之后,人们才能比较笼统地使用它,资本的助力使它变成了一个风口。

人机交互是智能交互领域的核心。

最早的人机交互通过代码形式实现,被称为CUI(Command User Interface)。比如最早使用的DOS系统(磁盘操作系统),向电脑输入一串代码告诉它我想干什么,电脑再反馈出一串代码告诉我有没有实现,这是最早人机交互方式。

后来人机交互发展到了2.0时代,被称为GUI(Graphical User Interface),可以进行图像交互。比如大家手机里都有很多APP,点击任意一个APP图标都可以进入到一个应用界面,这就是一种图像化交互。

从早期的代码交互到后来的图像交互,都是容易被我们忽略的交互方式,而AI正是在这些细枝末节中改变了大家的投资理念与投资趋势。

现阶段正处于2.0时代与3.0时代中间。3.0时代采用语音交互方式,我们称其为DUI(Dialogue User Interface)或者VUI(Voice User Interface)。举个例子,以前大家在开车时使用导航很不方便,首先要打开车载导航或者手机APP,然后输入地名,查看路线,这个过程需要一些时间。而语音交互技术的出现让操作变得更简单,导航、呼叫联系人等行为都不需要亲自动手,语音命令即可。

3.0时代后面还会有4.0时代,被称为NUI(Natural User Interface),自然人机交互界面。在3.0时代,语音交互存在一个问题,机器不知道应在何时提供服务,所以我们在与机器对话前,一般需要几个字节来唤醒机器,比如“Hello,XX”等,现在市面上的智能音响、智能精灵等设备在进行交互前都需要被唤醒,这种动作给用户带来了不便。与此同时,机器也无法识别出来与它对话的人是谁,还无法做到只识别主人的对话。在4.0时代,机器能够实现真正的智能化,可以在许多人同时交流的嘈杂环境中,识别出主人的声音,也能够判断出主人是否在与它进行交流,并提供相应帮助。目前还没有一个C端产品进入4.0时代,但人工智能的发展路径一定会朝着这一方向前进。

1.0时代到4.0时代的变化是人机交互方式的改变。如果在每个时代开始,都仅从底层技术去观察未来场景的改变,难度会非常大。4.0时代,代码、图像、语音等各种交互方式会融合在一起,制造一个智能空间环境,其价值产出会呈现出几何级增长。所以,4.0时代会成为人机交互发展过程中的一个核心。

考察智能交互同样离不开场景

语音交互跑道中可以深耕的内容非常多。比如在一个家庭场景中,男主人希望打开电视看球赛,其他家庭成员走过来希望换成别的节目,这就涉及到家庭成员间的博弈,机器如何做出判断就成了一个问题。现在的语音交互技术更多侧重于解析,把人们说的话变成文本,但人们在口语交流中存在许多不确定性和复杂性,机器在理解语言方面仍旧存在算法壁垒和设备壁垒。

语音交互技术包含一系列过程。用户说了一段话,机器首先要对这段话进行自动语音识别(ASR),然后进行自然语言处理和理解,之后进行对话管理环节,这一环节分为两步,第一步是搜索,第二步是决策,而后进行自然语言产出(NLG),经过一个白箱操作后将文本转换为语音,表达出来,这是智能交互的一个闭环。了解这个闭环有助于我们智能交互硬件的工作原理。

相比了解智能交互硬件的工作原理,对场景应用的了解更为重要。对于早期投资人来说,技术端创业的困难和挑战非常大。不仅要考察创业者的技术、资源、禀赋,又要了解产业背景。大部分投资人可以做FDD(财务尽职调查),但很难做TDD(技术尽职调查)。但是随着整个企业的上升发展以及成熟产品的出现,各位通过参照物能够更好地判断出产品和项目的价值。

判断语音交互技术的四个标准

在语音交互技术中,有四种技术是基石技术,也可以作为壁垒增加项目的可投资性。

第一种技术是降噪。在一个嘈杂环境中,我们面对一个机器说话,机器是否能够对麦克风进行降噪非常重要,尤其是在多人对话的环境中识别出特定人物的声音。从人体生理结构角度看,声音和指纹一样,也有“声纹”,识别不同人的声纹可以作为一种技术壁垒。

第二种是远场识别。人们和机器进行对话时,习惯于离机器近一点,担心机器听不到自己的声音,看似很小的动作,却涉及到一个本质问题:如果人类能够习惯于自然地和机器展开对话,不需要刻意靠近机器,就意味着语音交互技术取得了跨越性进步。

第三种是回声消除,基于语音唤醒和算法基础进行回声消除。这项技术很好判断,亲自试一下机器看看有没有回声就可以了。

第四种是声源定位。声源定位不仅依靠算法端的创新,还涉及到智能硬件技术。智能硬件的载体在人机交互过程中会起到非常重要的作用。比如在汽车场景中,如何将语音交互技术有机融合在汽车场景内,实现闭环和价值再创造?面对这个问题每个投资人都会有不同的想法。不论是早期、中期甚至独角兽企业,都想打造一个生态闭环。这种生态闭环必定和乐视的生态概念不一样,因为乐视的生态并没有获得消费者认可。即便是独角兽企业也只能在垂直闭环里的开展相关业务,从云端到芯片,如果突破了一个维度就会受到大家的质疑:目的是什么,是不是仅仅为了提高估值?所以打造生态闭环对各阶段企业,尤其是初创阶段的企业而言是一个很大的挑战。

智能设备的最大机会在于集成

设备和功能的集成是智能设备的发展方向。

一台智能交互硬件可以藏很多东西,比如一个苹果智能音箱,具备传统音箱的功能,可以播放音乐,它还可以结合思必驰或者科大讯飞的语音技术,让机器听懂人类的语言,不需要通过点击屏幕的方式就可以自动播放我们想听的歌曲。此外,现在很多APP都可以加载到智能音箱中,比如今日头条、墨迹天气,我只需要躺在床上唤醒APP就可以知道今天的天气状况和新闻事件;很多第三方服务商,比如美团外卖,同样可以添加到音箱里。

从集成角度去观察智能语音交互领域的初创企业,我们不能只关注技术水平的高低,因为很难凭借一两项黑科技就把其它头部企业打到,但是如果在智能硬件与应用场景的结合端有独特玩法,就仍有发展前景。

在移动互联网之外的NUI世界里面,会不会有一个独一无二的商业模式能够被巨头认可,是值得思考的问题。前不久网上有一篇对今日资本创始人徐新的采访,谈到了微信打败支付宝的原因:因为你大部分时间都在微信里面,要用支付宝,就要多戳一下,很多人不愿意。很显然,消费者变懒了。语音交互比打开手机动手指还要方便,按照这个逻辑,将来语音交互的赛道是不是不亚于任何一个风口?整个交互理念的转变要比单一技术的突破更具价值。

面对DUI和NUI技术,有两个大家都比较熟悉的场景可以作为举例分析的对象,一个是智能家居,另一个是儿童玩具和儿童机器人。

从DUI角度来看智能家居,就是让整个家庭空间变得智能化。在过去,当你进入到某个空间内,需要肢体运动来实现某些功能。而现在整个空间进化了,向智能空间进化的第一步是数据化,智能家居借助于物联网下端的传感器和上端的云储存,以及一套SaaS系统对你提出的要求给予反馈。第二步是真正的智能化,每个人的声纹、指纹、虹膜都是唯一的,空间可以识别你,知道你是谁,如果你不是家里的男主人或者女主人,它可以自动报警。如果是在商场里,商场可以识别出你是新顾客还是老顾客。所有基于人的场景都会成为被AI替代的一个潜在标的,但这个场景和标的有多大,值不值得被代替,都是仁者见仁、智者见智的问题。

现在很多儿童机器人都趋向于小型化,未来儿童机器人会走向芯片化。芯片内包含算法、设备、信号处理装置,所有功能都会芯片来实现,优势在于成本更低、功耗更低。这个场景里会有很大机会。

未来的智能终端将可以做成集分析、推理、演绎、归纳四部分功能于一体的设备,从这四个部分中演绎出的独角兽会很有意思。

智能交互领域存在五个机会

第一个机会在服务。目前移动互联网的逻辑是以信息为中心,尽可能多的获取用户数据。从大维度来看个人信息是不能随意提供的,消费者在你这里进行消费,还要提供隐私给商家,其实并不合理。所以未来的交互将从以信息为中心转变为以用户为中心,一切交互以最终任务达成为目的。今天的交互很简单,你想开灯,机器帮你把灯的打开,而且能识别出你的声音,只听你的命令。通过设备的铺设,将来各种第三方附加的增值服务都能够放在里面,实现语音交互技术与第三方服务的深度融合,打造智能空间的闭环。

第二个机会在场景端。技术催生垂直场景下的闭环生态。闭环中的生态场景不仅可以完成简单的数据搜索,还可能包括支付行为。如果一个创业企业从支付端切入业务,会面临很大的困难,需要资源禀赋、人脉禀赋,而且整个流程会非常复杂。但是以交互端切入,将闭环打造完成之后可以很容易将支付纳入进来。这得益于思维方式的不同,而不是技术的不同。

第三个机会在行业。智能交互在智能车载、智能家居、儿童机器人、医疗等行业都存在巨大机遇。交互带来的不仅仅是界面的改变,还可能向移动互联网一样催生出很多新的商业模式,而且一定不是像B2B、B2C这样的端对端,点对点的模式,一定是将技术和各种商业闭环的模式。

第四个机会在大数据。这里的大数据并不是通常意义上的大数据,而是垂直领域里的数据。

垂直数据领域现在有一个很火的词叫做:知识图谱。每一个垂直行业的知识图谱都需要大量的垂直数据。知识图谱可以衍生出垂直行业的一个虚拟客服,如果今后大家在淘宝上用文字与客服交流时,大家很难判断对方是真人还是机器人,那么这个知识图谱就算是成功的。大量垂直领域都需要这样的数据收集,涉及到不同维度的结构化和非结构化标注。这个方向的创业企业同样值得大家关注。

第五个机会在于重塑信息。智能交互可以打破信息孤岛。什么是信息孤岛?信息孤岛并不孤立,比如一个商场里可能有200家商铺,商铺之间距离很近,但是每一家都是一个信息孤岛,它们各自之间并不联通,单个商铺只和商场产生连接点,协同价值很低。企业做并购时会注重协同价值,创业企业同样要关注协同价值。信息孤岛的存在给智能交互领域提供了一个更大的想象空间。

我们当前面对的交互环境、场景非常多,对交互设备的需求也很多,未来的交互行为会发生在人与机器、机器与机器、人与人通过机器交互等多种形式中,这是宏观上能够看出来的趋势。(完)

[免责声明]

资讯标题: 驰星创投孙劲超:智能交互是AI投资的黄金赛道,存在5个机会

资讯来源: 36氪官网

36氪企服点评

在线作图相关的软件

查看更多软件

行业专家共同推荐的软件

限时免费的在线作图软件

新锐产品推荐

消息通知
咨询入驻
商务合作