2022斯坦福AI指数报告出炉!中国霸榜AI顶会,但引用量最低
【新智元导读】2022年人工智能指数报告发布了!这份报告中,中国在AI顶会论文上表现不凡,但在引用数量方面却低于美国、欧盟和英国。
今天,斯坦福大学发布了2022年人工智能指数报告。
李飞飞教授在报告发布后第一时间转发。
今年的报告主要分为5大章节:研究及发展,技术表现,人工智能应用的道德挑战,经济和教育,人工智能政策和国家战略。
以下将为你提取7项报告要点:
过去的10年,全球AI论文发表量实现翻番,从2010年的162444篇增长到334497篇,且逐年递增。
具体而言,模式识别和机器学习领域的论文,仅2015年至2021年的6年间,就实现了倍增,其它诸如计算机视觉、数据挖掘和自然语言处理等领域,保持了比较平稳的发展。
另外,从论文的刊载情况来看,期刊文章占比最大,51.5%;21.5%是顶会论文,17.0%来自存储库。
可以看出,在过去12年中,期刊和储存库的论文分别增长了2.5倍和30倍,但顶会论文的数量自2018年以来有所下降。
论文跨国合作来看,从2010年到2021年,中国和美国共同发表的人工智能论文数量全球最多,自2010年以来就增加了5倍。中美合作的出版物数量是中英的2.7,世界排名第二。
2021年,中国在人工智能期刊、顶会和知识库出版物的数量上继续领先世界。这三种出版物类型的总和比美国高出63.2%。
与此同时,美国在人工智能顶会论文数量和存储库引用的数量上处于领先地位。
就AI期刊论文发表数量来看,过去12年人工智能期刊论文发表数量占比,中国始终霸榜,2021年为31.0%(2020年占比18.0%),其次是欧盟和英国,为19.1%,美国为13.7%。
2021年,中国在AI期刊的全球引用量依旧领先。
值得注意的是,不论是AI期刊论文发表数量、引用数量,美国从去年第2名降至第3名。
那么中美在顶会发表论文的情况如何?
2021年,中国以27.6%的比例在全球AI顶会发表的论文数所占份额最大,比2020年的领先优势更大,而欧盟和英国以19.0%紧随其后,美国以16.9%位居第3。
然而,美国一直在AI顶会论文引用量上居高不下,2021年引用总量占比29.52%,排名第2和第3的分别是欧盟英国(23.32%)和中国(15.32%)。
中国从去年第2名跌倒第3名,从侧面可以看出,中国论文发表数量最多,但质量不如美国高。
总体来看,2021年人工智能专利申请量是2015年的30多倍,年复合增长率为76.9%。
具体讲,中国申请了全球一半以上的AI专利,并获得了约6%的授权,与欧盟和英国大致相同。
与不断增长的人工智能专利申请和授权数量相比,中国的专利申请数量(2021年为87343件)远高于授权数量(2021年为1407件)。
最受欢迎GitHub开源库:TensorFlow
从2015年至2021年GitHub开源AI软件库的用户数量可以看出,TensorFlow仍然是2021年最受欢迎的,GitHub累计星数约为161,000,比2020年略有增加。
排在第2名的便是OpenCV,紧随其后的是Keras、PyTorch 和 Scikit-learn
先来看一组照片,这展示了人脸生成水平的年序发展。
对比2014年,我们仅能将原本肤色表情丰富的真人,生成一张黑白且模糊的人脸,但是到了2021年,计算机对黑色皮肤也能揭示更多细节,我们看到了图像人物皮肤的黑里带棕,以及表情的露齿带笑。
报告展示了计算机图像如何分类,下图包括飞机、自动汽车、鸟、猫、鹿、狗、青蛙、马、船、卡车等各种类别,通过给定图像的分类模型与目标标签,提高了图像识别的智能化程度。
报告指出,随着深度学习运用于AI图像,图像分类的准确性有了很大提升。
以下是AI图像识别准确性的对比图,蓝色线条代表没有使用训练数据,绿色线条代表使用了训练数据。很明显,绿色线条(准确率99.02%)超越了蓝色线条(准确率97.9%),这意味着,AI图像识别经数据训练后准确性提高。
而无论是否使用深训练数据,AI图像分类(99.02%&97.90%)在2017年后均表现出了高于常人(94.9%准确率)的水平。
看来,「脸盲症」只存在于人类,AI几乎不会患。
报告使用了一份来自北京邮电大学的口罩人脸图片集,这6000个人脸识别数据集,提升了疫情期间人脸识别的准确率。
口罩遮挡住面部,这使得人脸识别系统收集到的面部信息大量减少,然而,来自中国的AI团队将人脸识别的关键信息集中于眉毛和眼睛,并采用正确的模型进行训练,实现了「戴着口罩也能刷脸」。
来看一下,计算机如何进行视觉常识推理的。
视觉常识推理,Visual Commonsense Reasoning(VCR)是AI领域的前沿热点问题,这是一项非常富有挑战的任务,包括认知、学习、推理,从单一的视觉问答、图像识别、动作捕捉等数据处理,上升到「跨媒体智能」,代表了计算机视觉理解的新基准。
报告指出,目前,计算机视觉常识推理能力远远落后于人类,人类的视觉常识推理水平一直维持在85分,而2021年机器的最佳得分只有72分。
看来,这确实有点Low,不过相较于2018年的不及格水平(43分),机器用3年时间提高了29分,显然是在大步向前了。
近年来,得益于语音识别技术的发展,完全机器翻译的服务应用大幅提升,占比46%。
相较于其它的应用,机器翻译的商业应用增速明显,商用规模从2019年的21%扩大到2021年的38%,近2倍。
报告使用了2015年由斯坦福大学Bowman等人提供的自然语言处理的问题和标签。
自然语言处理是在给定确定任务的前提下,假设4种逻辑,即错误(contradiction矛盾)、未决定(neutral中性)2种、是否为真(entailment蕴涵),机器对进行合理与不合理的推论。
报告显示,2021年自然语言处理的精准度已达93.1%,而在2017年初就已经达到90%,这是在高起点的基础上实现缓增长。
斯坦福自然语言推理(SNLI)数据集包含约60万对被标记的句子,其性能精度是基于答对问题的百分比。
从今年报告的总体体量上而言,较之于去年的7章,今年报告浓缩至5章,减少了「AI的多样性」部分,并将「AI经济」和「AI教育」合为「经济和教育」1章。
虽然总章数减少了,但是体量却变大了,目录页码由177页增加到了196页。
Burning Glass数据涵盖的六个国家对人工智能劳动力的需求在过去九年中显著增长。其中新加坡AI招聘岗位在总招聘岗位中占比2.33%,排名第一,美国0.90%排名第二。
就人工智能领域投资来讲,从2013年到2021年,美国对人工智能公司的私人投资是中国的2倍多。
中国的AI投资出现了增长,从2020年的10%上升到了2021年的17.21%。
报告下载地址:
https://aiindex.stanford.edu/wp-content/uploads/2022/03/2022-AI-Index-Report_Master.pdf
本文来自微信公众号“新智元”(ID:AI_era),36氪经授权发布。