编者按:本文来自微信公众号“CV智识”(ID:CVAI2019),作者 余洋洋,编辑 张丽娟,36氪经授权发布。
看得懂商业的人不一定能理解那种最为复杂深奥的科技,但在学术界耕耘几十年的科学家们,在走出实验室的一亩三分地之后,却从来不缺乏在工业界施展身手的机会。
“北京的学校差不多集中了中国十几亿人中最优秀的人才。”
正如商汤科技创始人、前MSRA视觉计算组主任汤晓鸥所言,位于中关村科技园区腹地的微软亚洲研究院(MSRA) ,北接清华、北大,南临人大、北理工,东近北航、北邮,由于近水楼台先得月,这里汇聚了一批中国最优秀的科技人才。
商汤的汤晓鸥、王晓刚、林达华、杨帆,旷视的孙剑、印奇,依图的朱珑、林晨曦、颜水成,码隆科技的黄鼎隆、Matt Scott,中国的AI先驱与创业者们在这里相遇,他们曾是在MSRA勠力同心做研究的同事、师徒。走出MSRA,投入到火热的AI创业浪潮里面去,他们摇身一变成为公司创始人、CEO、首席科学家。
MSRA为他们提供了一个一起做研究、互相交流、互相认识的绝佳平台。即便离开研究院,转战商海,面对的又是另一翻天地,身份变了、角色变了,不变的是科学家们多年来共同坚守在科研一线所锻造出来的信任与情谊。
相对的,中关村如同海明威笔下那一席流动的盛宴,“如果你有幸年轻时在巴黎生活过,那么你此后一生中不论渠道哪里她都与你同在。” 簇拥在熟悉的MSRA周围,年轻的AI独角兽们在这里茁长成长。
而在没有自己的可落地产品之前,这些新兴的科技公司往往需要几位知名专家的背书,于是有了“首席科学家”、“研究院院长”的存在。
对于AI公司为何热衷设立研究院并请学术大牛坐镇,香港科技大学计算机系与数学系教授、前腾讯AI Lab主任张潼就向CV智识分析称,“研究院有几个功能,一个功能是它会在短期项目上支持一些产品;另外一个是本身它也会对做一些技术储备,为开发一些产品做积累;还有一个我觉得挺重要但被忽略的一点,研究院作为公司的人才储备,在产业迅速变革的时候,这些人才才能产生价值。”
在张潼看来,微软在多轮时代浪潮之中成功转型,重回全球市值第一宝座,正与其人才储备息息相关。
“比如说微软,”张潼告诉CV智识,“它原来就是一个软件公司,但后来在做搜索的时候,虽然没有做到谷歌的程度,却能够很快地起来,包括现在做云计算,它为什么能够成为市值最高的公司之一?就是因为技术的储备、人才的积累,在公司转型上,如果没有这些人才储备,就没有办法去做这些事情。”
“首席科学家”、“研究院院长”们带领着各自的公司,不断地突破技术难题,为创始人、CEO分担了不小的一部分压力。
一
王晓刚是商汤的联合创始人之一,同时也是商汤研究院院长。年轻时的王晓刚和汤晓鸥等人一同经历了许多学术生涯的高光时刻。
二人都毕业于中科大,都曾赴麻省理工学院(MIT)求学。王晓刚赴港中文多媒体实验室读书期间亦师从汤晓鸥,且是后者的得意门生。随着商汤的成立,王晓刚又和汤晓鸥一道,踏上北去的路,担任商汤研究院院长至今。
而当时,时任MSRA副院长张宏江向正在香港中文大学信息工程系做老师的汤晓鸥发出邀请,希望他来担任媒体计算组主任。虽然舍不得离开远在香港的妻儿,汤晓鸥仍然在新任MSRA院长沈向洋的撮合下加入计算机视觉组,媒体计算组也被并入计算机视觉组,由汤晓鸥一并带理。
“我第二天就答应了,Harry(沈向洋)也怕夜长梦多,隔天我们就把很多细节敲定了,没有经过任何面试,我就在几天之内成了研究院的人了。周六,我就买了房子。那一周,感觉上像两个恋人生怕对方反悔而匆匆领了结婚证。”
汤晓鸥曾在一篇自述中回忆起那段经历,虽然匆忙,但他丝毫未觉得后悔,“我对研究院其实爱慕已久,研究院在我心里很像铭铭,大有天下第一铭(名)的气势。”
正如汤晓鸥在自述中所言,在MSRA任职三年之内,汤晓鸥带领团队在一流的计算机视觉会议(ICCV[2], CVPR[3], ECCV[4])发表了60多篇论文。发这些论文的另外一个好处是吸引了很多好学生,“这些年我见过很多非常优秀的学生,有些已不能用优秀来形容,只能说是天才。”
王晓刚正是汤晓鸥在MSRA遇到的“第一个天才学生”。
在汤晓鸥眼中,王晓刚在硕士阶段就发表了五篇CVPR/ICCV。除此之外,汤晓鸥还颇为欣赏王晓刚的人品,“他的才华和人品如此出众,以至于我毫不犹豫地将妹妹嫁给了他。”
商汤研究院院长王晓刚
2009年从MIT毕业后,王晓刚回到港中文任教,与汤晓鸥一道并肩作战。王晓刚不负汤晓鸥所望,在2014 年的 ImageNet 大规模物体检测任务比赛中,王晓刚、欧阳万里和汤晓鸥带领他们所在的团队 DeepID-Net 首次参赛便以 40.7% 的优异战绩位居第二名。
ImageNet 是视觉识别领域一年一度的“奥赛”,对计算机深度学习影响深远,在 ImageNet 上取得的技术进步往往都会给其它计算机视觉问题带来重要影响。
几个月后,DeepID-Net 团队更将此项成绩大幅提高至 50.3%,一举超越长期作为第一名的谷歌,达到全球最高的检测率。这一成果发表在 2015 年国际计算机视觉与模式识别大会 (CVPR) 上,是当时世界上在 ImageNet 挑战中最高记录。
而在此之前,汤晓鸥和王晓刚带领的 DeepID 团队在 LFW 人脸识别挑战上也一度战胜 Facebook,并在全世界首次实现人脸识别算法超越人眼识别准确率的经历。
DeepID-Net团队,右五为汤晓鸥,右三为王晓刚
2014年,伴随着商汤的成立,王晓刚同样开启了往返于香港与北京两地的生活,他在商汤研究院担任院长,从学术界到投身工业界,见证了算法落地过程中产生的无数问题与突破,也经历了从最初从零开始组建商汤研究院的团队、招徕人才,研究院规模逐步扩张又逐步收缩的全过程,顶峰时期的研究院曾达到近两千人。
不止王晓刚等几位联创,CV智识曾与多位商汤内部人士交流,不少港中文多媒体实验室(mmlab)的博士,都会选择在毕业之后加入商汤,而师生之间会有一个纽带,港中文的博士自然而然更受公司信任。
2016年7月,前微软亚洲研究院首席研究员孙剑加入旷视,一时间引起业内热议。事实上,孙剑曾是印奇本科时期在微软实习时的老师。
孙剑为MSRA效力十余年,一路从小兵成为首席研究员。近年来,微软亚洲研究受到来自科技创业公司的各种冲击,越来越多的高级研究员出走MSRA,成为创业公司联合创始人、CTO。
更早期的一些MSRA人如李开复创立了投资机构创新工场并担任董事长、林斌担任了小米总裁、张亚勤出任百度总裁、张宏江一度出任金山软件CEO。这种背景下,孙剑选择了离开,并加盟旷视。
“我是06年到10年的清华本科,而且同时我在微软研究院(MSRA)大概前前后后实习了三年多时间,那一块可能是我更专项的科研起步的一个地方,”印奇曾在接受创新工场采访时回忆起在MSRA的时光。彼时,正是印奇与人脸识别的初次“亲密碰面”之时。
而随后在旷视内部,也有一个负责基础研发的研究院。这被旷视科技视为自己技术的核心竞争力之一。
孙剑的到来更添了旷视研究院的光彩与实力。论是名声,孙剑是MSRA的首席研究员;论实力,孙剑在学术科研领域获得的成就不计其数;而论人情,孙剑则是印奇科研起步的引路人,三年的共处足以让二者建立起对彼此的信任与情谊。
2001年,作为微软亚洲研究院和西安交通大学联合培养的孙剑选择了留在微软亚洲研究院,并且将研究方向放在了计算摄影学, 人脸识别和基于深度学习的图像理解。2004年,孙剑第一次以博士的身份参与了一项图形学的项目研究,不久后便成为了微软亚洲研究院的主管研究员。
年纪轻轻,却学术成绩斐然,2010年,孙剑凭借着在学术界所产生的强大影响力,被美国权威技术期刊MIT Technology Review评选为“全球35岁以下杰出青年创新者”。
2015年,孙剑带领的团队在ImageNet计算机识别挑战赛中,通过对152层神经网络的应用,以绝对优势获得了图像分类、物体定位以及物体检测全部三个主要项目的冠军。
在外界看来,孙剑身上似乎有着挖不完的宝藏,比如,他曾参与研发了一款名噪一时的“颜龄机器人“How-Old.Net” ,这款产品可以根据用户上传的照片来迅速定位、检测、识别并且判断年龄,除此之外,孙剑还坐拥四十余项国际或美国专利,他和他的团队的研究成果已经被广泛应用在微软Windows、Office、Azure、Bing、Xbox等产品中。
印奇说,从人才引用来说,孙剑是其在微软这几年的导师,也是华人圈子里最优秀的计算机视觉专家。更重要的则是自己和孙剑相互认可,人工智能领域也是未来的大趋势。
与群星环绕的商汤、旷视不同,由朱珑与同窗好友林晨曦一道创立的依图科技,地处上海,行事低调。公司成立7年以来,几乎从未有过业界大牛加入依图的消息,依图亦没有如汤晓鸥、姚期智一般的业界元老坐镇后方。
然而就在今年7月,原360集团副总裁、人工智能研究院院长颜水成正式宣布加入依图,担任依图首席技术官。
颜水成念旧,在北京大学数学科学学院呆了9年,学习计算数学和应用数学,而真正与人工智能结缘,则是在2001年进入微软亚洲研究院。
在MSRA期间,颜水成师从人脸识别和智能视频监控专家李子青以及计算机视频检索领域开山鼻祖、微软亚洲研究院创始人之一张宏江。
在MSRA与朱珑和林晨曦相识,最终成为颜水成加入依图的契机。
“早期的CV创业公司大部分与微软或黄煦涛教授都有关系,我在两个地方都呆过,所以大家都相互非常熟悉。与依图创始人朱珑在MSRA同一office呆过很长时间,与联合创始人林晨曦在MSRA也有过交集,同时对依图的发展过程也非常了解,所以朱珑相邀时,加入依图的决定也就非常的简单和迅速。”
2006年,颜水成暂别MSRA,赴伊利诺伊大学香槟分校(UIUC)留学,师从美国工程院院士、计算机视觉大师黄煦涛(Thomas Huang)。2008年,颜水成加入新加坡国立大学,逐渐成为NUS的机器学习和计算视觉领军人物,并成为新加坡国立大学任终身教职。
在加入依图之前,颜水成360集团的任职经历,也给学术背景深厚的他,带来了重要的工业实战经验。
2015年,颜水成加入360集团。在360集团期间,他带领团队多次在计算机视觉竞赛领域斩获奖项,更重要的是,在他带领下,研究院的人工智能技术已经广泛应用于360的全系列产品中,包括直播、智能硬件、搜索和信息流等业务。
“让AI落地”也是颜水成的工作理念之一,他曾在多个公开场合强调AI技术在产业落地的重要性。
颜水成的加入毫无疑问为依图增添了强劲的技术实力,为后无业界元老、前无首席科学家的依图补齐了首席技术官这一职务。作为首席技术官,颜水成将与依图团队一起,进一步加强 AI 基础研究。同时,为依图找到更多的技术型人才,也是颜水成的重要任务之一。
此前曾有一位依图内部人士告诉CV智识,从去年八月开始,依图的团队从之前的三四百人,在八九十三个月之内迅速扩大,“能明显感觉到今年公司开始发力,各个业务线都开始准备。”
颜水成的到来也将使得依图在扩张的过程中如虎添翼,更多AI人才或将慕名而至。
2008年,进入MSRA的黄鼎隆与时任MSRA高级研发主管Matt Scott相遇,二人由此结缘。
Matt多年都是微软绩效排名前1%的杰出员工与管理者,曾主导开发的“必应词典”。黄鼎隆则在MSRA担任产品经理。Matt与黄鼎隆的联手源自必应词典开发,当时院内将其称为“黄金搭档”。
黄鼎隆看好AI在零售领域的落地应用,“在未来,可能所有的超市、商店都能做到7*24小时营业,顾客只要推着推车,走过摄像头就可以知道买了哪些东西、要付多少钱了,排队结帐的麻烦将被科技解决。在店里面放一个摄像头,这个摄像头会像永不会休息的收银员一样去工作。”
商品识别的应用前景并不像今天这样清晰的时候,黄鼎隆就意识到了这个领域的潜力。2014年Matt与其中国女友结婚之后,Matt与黄鼎隆在讨论中一致看好深度学习将会带来的AI革命,二人遂相约创业。此后不久,码隆科技创立,取二人名中各一字。
MSRA好像一座围城,二十年间,不断有人怀揣着憧憬进来,又不断有人带着梦想离开。技术人下海创业、自立门户,科学家追随其后、鼎力相助,已不仅仅是MSRA人的特权。
创业初期的码隆科技,中间蓝色衣服为黄鼎隆,黑色为Matt Scott
“这个行业的人多出去自立门户,”曾有一位AI行业内人士这样向CV智识感叹,“MSRA的有一波,百度的一波,港中文、港科技的一波,中科院的也有一波。”
伴随着AI进入暗流汹涌的商业化落地竞争阶段,更多的科学家开始离开象牙塔,领导科技公司的研究部门。
马原原是旷视安防业务线的负责人,2018年,他离开旷视并创办了自己的AI公司澎思科技。今年三月,澎思招徕华人AI科学家申省梅加盟澎思担任首席科学家,同时成立新加坡研究院,负责研究院的团队建设和人工智能前沿技术的探索。
有趣的是,马原和申省梅曾是“师姐弟”,二人皆毕业于西安电子科技大学。申省梅1984年本科毕业于西北电讯工程学院(现西安电子科技大学),专业方向电子对抗;马原则是西安电子科技大学第一批智能科学与技术专业的毕业生。
无独有偶。
姜安在中科院自动化研究所待了近十年。2012年,他离开中科院,进入当时如日中天的诺基亚,但好景不长,2013年微软收购诺基亚,紧跟着2014年微软大裁员,被裁的同事后来陆陆续续去了IBM、英特尔。
对于姜安来说,这场裁员风波却恰恰引发了他创业的念想,“老是给资本家打工,还不如自己干,所以2014年趁着裁员之际带着一拨弟兄出来创业,也算自谋生路吧!”
说到做到,姜安带着几位来自中科院、诺基亚、微软、三星、西门子、华为、丰田的博士及工程师创立了中科慧眼,公司的首席科学家是中科院副研究员,研发总监是中科院研究员、博导,整个研究团队由他最信任的中科院师兄弟们领导。
一端连接学术,一端连接商业
从学术圈到工业界。在AI商业化的浪潮之下,科学家们络绎不绝地走出研究机构,投身创业热潮。
因为懂技术,有名望,科学家们往往是年轻AI公司的最佳“台柱子”。凭着多年在学术圈积累下来的名望与成绩,他们为公司招徕人才,组建出一支能“过冬”、能“打仗”的技术军团。
张潼告诉CV智识,研究院或者说AI Lab最重要的意义正是为公司的长远发展做积累,它体现的是一家科技公司的技术前瞻性。
“如果你想马上解决你现有的产品上的问题,那一定在产品部门是最好、最快的,”张潼告诉CV智识,但在研究院“有一些更加基本的不一定是马上就能够用到的,也许是一年、三年、五年。”
科学家是“台柱子”,却又绝不仅仅是“台柱子”。
看得懂商业的人不一定能理解那种最为复杂深奥的科技,但在学术界耕耘几十年的科学家们,在走出实验室的一亩三分地之后,却从来不缺乏在工业界大展身手的机会。
在AI商业化落地的需求已经如此迫切的今天,他们谨慎把握着算法与落地之间的平衡,也焦虑着创始人的焦虑。
天下第一铭——汤晓鸥教授的自述故事。汤晓鸥。
旷视科技印奇:风口是等来的,不是赶来的。创新中国第一季。
专访Face++ CEO印奇:融资4.6亿美元后将造更多超算中心。雷帝触网,雷建平。
颜水成博士加入依图科技,任首席技术官(CTO)。依图科技。
领航者|码隆科技黄鼎隆:AI能成为各个行业的老师傅,凤凰卫视资讯台。
主题演讲《预见无限可能》,姜安。