百度那只笨重却有着一身网红梦的机器人,终于参加了它在《最强大脑》的最后一场综艺。
36氪曾经报道,综艺节目《最强大脑》在第四季设置了人机对战环节,百度将“百度大脑”的人工智能技术植入到机器人“小度”人上,来节目上踢馆。
前三期人机大战,小度要和名人堂中的某位选手在人脸识别、声纹识别上面PK,采用三局两胜制,百度大脑如果胜出,就可以参加最后的脑王争霸赛。在前三期节目中,小度分别赢了记忆大师王峰,与听音神童孙亦廷打平,战胜鬼才之眼王昱珩(人称“水哥”)。作为粉丝,我要为我水哥流泪,水哥肯定是一时失手……
小度成功活到了最后一集,这次它参与的有三个项目:图像识别、跨代人脸识别和声纹识别。
第一个叫沧海桑田,跟一位名为黄政的选手比。节目组有三十张不同城市的老照片,每个老照片中会选出今昔相同的有效信息碎片,嘉宾选一个。选手需要根据老照片碎片,在三十张现代照片中找出具体位置。
左边是老照片细节,右边是三十张现代城市的照片
图中黄色框框就是局部细节所在地
不得不说,这样一个项目,对人类来说实在太变态了吧?!
一来可以看到老照片有多模糊,截取的碎片有多小;二来就算能脑补到图中碎片是屋顶,现代照片中屋顶的地方也不少。最后,人类选手黄政选择对了城市,却标错了碎片在城市中的位置,小度选择正确,但是小度和人类携手帮助华侨找到了家乡。正如现场科学家指出,对人类而言,他是先判断是哪幅图,再从图中匹配细节,而人工智能是直接匹配细节。
不过说到第二场的项目,看上去有点6,叫做跨代人脸识别。嘉宾在40张父母合照中随机挑选一张,选手观察照片后,从40位造型一致、身材接近的女生中,找到该父母的亲生女儿。
左右是父母,右边是候选人名单
为什么说这部分的项目有点腻害?
要知道,平时我们遇到的人脸识别,是同一个人的匹配,第二期的人脸识别,则是跨年龄同一个人的对比,这次完全是通过不一样的人,找出他们两个子女。
我们知道,父母和孩子长相能有多相似,这是不确定的,基因的遗传分为显性和隐性,比方说父母一方是大眼睛,那么孩子可能是大眼睛,也有可能是小眼睛;甚至还有基因突变的情况,孩子的某些特征是父母双方都不具备的,这几乎是双方面临最大的挑战面临的最大挑战。
对了,更悲催的是,人类选手那边,迎战的是一位外国选手,Alex。最后,现场嘉宾陶子姐和人类选手,都选错了,只有小度选对了。
不过据百度的研究人员表示,其实比赛中的隔代识别仍属于图像识别分类中的人脸识别,只是难度更大。36氪曾经撰文解析过人脸识别的过程,隔代人脸识别的技术原理与人脸识别相同: 形成灰度图,分别提取父母面部的特征点和孩子的特征点,进行比对。赛前通过多次机器学习,在各种变量中间平衡,提高识别的正确率。
百度表示,几期比赛结果也反映出,机器的人脸识别其实远超过人类,在过去的三场比赛中(第一期和第三期),人类选手做对了2道题,而机器却做对了5道题。
最后一个声纹识别的项目,是根据笑声匹配说话声音,让小度听一段嘉宾挑选的笑声,它要从采集完整的30段说话声,选出说话声的主人。
这个项目跟第二期的根据歌声匹配说话声很像,那一期,节目组请来了一组专业的高校合唱团(21人),嘉宾周杰伦从中选出了声线相近的三个人,分别对他说一句话,节目从中截取不连续的三秒,选手需要根据三个片段,听现场听合唱团合唱一曲,然后从中选出嘉宾选的三个人分别是谁。
当时,听音神童和小度,在三题中,都只做对了一道题。这最后一集的听音项目中,只有小度自己solo,很遗憾,这次他也做错了。
可见,相较于人脸识别,百度的声纹识别相较之下还没那么成熟,百度研究院院长林元庆也承认,如果说百度的人脸识别已经在山顶附近,声纹识别目前还在半山腰之上。
看完上述一些新颖神奇的技术,我特别好奇,究竟这样的技术有什么用呢,就比如其中最奇葩的根据父母的样貌匹配孩子,毕竟也不可能准确预测两个人生出来的孩子长什么样,即便可能了用来相亲也不太合适。
你可能没想到的是,这个技术还真的有用处,而且还跟Robin厂长之前在两会上的提案有关。
还记得章子怡曾经在最强大脑上提到过跨年龄人脸识别的技术可以用于寻找早点丢失儿童,因为很多小朋友长大之后,连父母也认不出来了,如果先通过人脸识别找出匹配度比较高的,再去验证,就可能节省很多成本,也能提高寻回可能性。
百度还真的就这么做了。
百度和宝贝回家的合作
他们说,在参加完前三期的《最强大脑》之后,百度大脑跨年龄人脸识别的能力飞速升级,现在已经成为了一项可以稳定运用、服务社会的新技术。据林元庆介绍,目前,百度与宝贝回家已经开始合作,百度的人脸识别技术已经对宝贝回家的人寻家、家寻人两个数据库,一共6万多条数据进行技术分析,目前成功对比出30余对相似图像,这批数据已经交给警方,警方会对这些寻亲人进行DNA核实认证。
林元庆还小得意地分享了一个好消息,在这30多对头像,已经有一对最近相认了,就证明了百度匹配出来的确实有对了,虽然这对碰巧百度人脸识别介入之时,就刚好相认了。
氪星读者们可能会发现一个小bug,上面提到的家寻人和人寻家两个数据库中,前者主要是靠走失儿童父母上传孩子小时候的照片,后者则主要是走失儿童长大到一定年纪,自己上传照片,寻找父母。显然,尤其在人寻家数据库中,需要孩子主动上传,两个数据库的图片库难以很全面,覆盖所有丢失儿童。
全社会的脸部照片库,只有公安部等政府机关有,因此,李彦宏在两会上提提案,就是希望政府相关部门可以在数据上跟百度合作,提升儿童走失案件的侦破效率与破案率,具体包括:建立适用于搜寻走失儿童的人脸识别模型;建立覆盖全国的走失儿童数据库;将人脸识别技术与治安、交通监控系统相结合。
百度介绍,目前,在跟宝贝回家的合作中,主要是用到了跨年龄人脸识别,但上述比赛项目中的隔代人脸识别,也能发挥作用。比如,如果某家父母丢了孩子之后想寻回,却没有孩子的照片,也可以用他们自己的合照。不过显然这种可能性比较少……一般来说,在现有的跨年龄识别中,辅之以隔代人脸识别,可以提高匹配准确率。
此外,截至2017年3月,百度与民政部合作推出的基于人脸识别技术的百度寻人平台,已对接民政部全国救助寻亲网27003名走失者的数据。民政部会与地方救助站等多方机构协调,让每一名被送到救助站的走失者,能采集图像数据并上传数据库。百度搜索“百度寻人”即可到达该页面。
至于第三个项目声纹识别,应用领域则比较清晰,主要是身份验证,微信就有类似的声纹识别登陆。从安全性上考虑,即使已经有了人脸识别,如果加上声纹识别,双重验证,安全性就会更高。
林元庆表示,声纹识别也很重要,比如在智能语音交互领域、智能家居布局等方面,如果小度可以单凭声音识别应该听从哪个人的指令,用户体验就会好很多。
不得不说,听完之后觉得这上面的跨年龄人脸识别和跨代际人脸识别的应用确实很有意义,但主要是公益意义,如果从百度自身的商业化来说,又能给百度带来什么呢?
从整个行业应用来说,如今不少人脸识别的应用场景,还主要是B端,需要一家家去BD,在这个难以赢者通吃的市场,押注人工智能的百度要如何做出一个拯救自己的爆款产品?