编者按:本文来自微信公众号“果壳”(ID:Guokr42),作者:吉小迪er,编辑:Owl、窗敲雨,36氪经授权发布。
你好,欢迎参加果壳杯“智力大测验”,话不多说,请看题:
题目1:4938,3526,3124,2621,1714,( ? )
A.1565 B.1433 C.1916 D.1413
题目2:
题目3:
每到毕业季,对于各式“奇葩笔试题”的吐槽就没有断过。这些题目总是初看“啥呀?”,一旦知道答案就会“噢!”,像极了小时候的脑筋急转弯,知道答案后甚至想翻个白眼。?
这些题为啥这么难?测出来的结果和工作又有什么关系?
每年招聘季,吐槽的重火力区都集中在图形题上。这类看起来像是脑筋急转弯的题型,答不对还真的要怪大脑:它的解题思路和我们大脑处理信息的习惯大不相同。
日常生活中,大脑为了快速有效率地判断周围发生的事情,会让“整体优先”:注重于物体图形的整体而忽视掉某些没有必要局部细节。另外,大脑看物体的时候很容易为他们赋予意义,从而快速判断眼前的物体的重要性:眼前的长方形物体是一条蛇还是一块糖果,远处的人形是班主任还是隔壁小红,这些可以帮助我们快速决策。
“整体优先”和“意义优先”让我们在生活中可以看到很多“脸”
然而在做图形题时,“整体”和“意义”都只能帮倒忙:这类题目要求人们把图形拆分线段和面积考虑, 并且思考他们之间的关系。
比如说下面这道题,你肯定一眼就注意到了画面的“意义”:各种面带笑容或是愁容的小人脸。
表面笑嘻嘻,内心苦兮兮丨参考文献[1]
但这表情能有什么规律呢?盯着它们看,简直让人火大,一怒之下想选D表达内心的不满……其实,答题思路跟表情含义没有半毛钱关系:从左到右全是逆时针旋转,同时左到中眼睛翻转,中到右嘴巴翻转,因此答案是C。好气哦,但还是要微笑呢。
又比如下面这题,如果看整体图案,会让人很想把右下角的圆圈补全,那么答案一定得在ACD里吧?
“圈圈圆圆圈圈……”林俊杰写《江南》,是因为刚考完试吧?丨参考文献[1]
嘻嘻,又错了,其实应该选B。每行前两个方形里出现的相同曲线,在第三个方形里都不会出现。以后给浴室装修全部刷白,瓷砖花纹PTSD了哈。
再比如这道题,在这么多圈圈框框之中,你第一眼看到的一定是左下角的“人脸”,并和他一样发出了“啊”的无奈。
这个?正是我现在想发出的符号丨参考文献[1]
然而,实际答案只和线段有关:每个方框里的曲线图形比线段图形多一个,选B。
在这些题目中,大脑“意义优先”的能力反而让我们屡屡受挫:大脑赋予图形意义的速度太快,干扰了我们对图形细节的观察。
很多人总结了图形题的考点,封闭区间、线条数目、结构特点……但看完总结,你还是会发现:这些我都知道,但做题时还是啥都不会啊!虽然我们知道了图形的各类规则,但如何快速匹配不同的题目,对于大脑来说依然不容易:每一道题都有多种潜在规律。大脑在面对题目时要逐个测试可能的潜在关系,并且我们大脑天生比较“懒惰”,虽然意识到一个规律发现不太适用,但还会抗拒切换到下一个规律。同时存在着一种转换成本,使大脑切换到一个新规律时反应速度变慢。
要在无数可能的规律中快速切换,、试错,着实不容易。可话说回来,费这么大劲答的题,和我入职究竟有什么关系?
各家公司的笔试题目一般不仅包含前面所说的图形推理题,还包括数字运算、语言理解、资料分析等。这一套测试与智力测验有相似之处(虽然并不完全相同)。
美国心理学家雷蒙德·卡特尔(Ramond Catell)在上个世纪60年代提出, 人的智力可以被分为流动智力 (fluid intelligence) 和晶体智力(crystalised intelligence)。智商测试题一般测试的是流动智力。
流动智力指的是我们感知和推断变量之间的关系,并概念化抽象信息的能力,可以被广泛应用于解决各种问题。而晶体智力, 是指利用通过先前学习获得的技能和知识的能力,比如语言语法, 数学概念, 计算规则等等。
由此可见,流动智力相对于晶体智力更加独立于受教育程度、经验以及知识的积累。
目前最常用的智商测试题是韦氏成人智力测验(Wechsler Adult Intelligence Scale)和瑞文氏标准推理测验 (Raven's Progressive Matrices),后者被视为是更“纯粹”的智商测试题,因为它只涉及图形的推理,无需阅读文字或者学过数学,更少受教育的影响。这样看来,笔试中最“奇葩”的图形推理部分,看似跟工作任务所需要的认知能力最不相关,但恰恰跟智商测试最契合。
除了图形数字逻辑,还有很多语言理解题丨参考文献[1]
常见的笔试题除了基于流体智力之外的图形推理、逻辑判断、类比推理题之外, 还有很多测试需要靠后天学习积累增加的晶体智力的试题,比如语言理解与表达、数学运算、资料分析等等。
既然测的是智力,那参加培训班还有用吗?
心理测量所追求的就是练习不会对智商产生太大幅度的影响,如果通过自己练习就能提高分数,那测试本身的可靠度和准度就会受到质疑。
不过工作笔试题和心理学测量的目的并不一样:对于以“获取高分”为目的的考试,从答题技巧层面来说,培训还真有点用。
随处可见的培训课,还挺贵
笔试中题型跟智商测试题型越接近的越难以通过练习提高。比如,需要使用3D空间想象能力的图形推理题, 想通过练习进行提升的效果非常小。但对于资料分析题、文字阅读理解题等,则可以通过学习答题技巧,大幅提高答题速度与准确率。
如果通过培训就可以快速提高分数,那这样的考试还有意义吗?
心理测量的试题,在开发初期都是经过不断测试和更新迭代,使得最终的分数分布可以成正态分布,这样可以使个体之间的差异可以尽可能大的被区分开,而有区分度的行测题也是如此。
试题的设置要确保获得群体平均分/中位数的人数最多,而跟平均数差距越大, 获得此分数的人占比越少。丨参考文献[6]
可再完美的试题,也抵不过时间的流逝。近几十年,心理学家发现了一个现象:随着医疗健康、教育水平等因素的改善,平均智商测试分数在逐代增长,这一现象被称为为弗林效应(Flynn effect)。同时大量题库的出现会加速人们分数的提升,如果这个趋势继续下去,最终很有可能大家的分数都很高并且接近于满分。
为了解决这些问题,“反培训”方案也被安排上了。出题团队不仅会对不同次考试的一致性、可靠性进行分析,还会对不同考试之间相似题型的相关性进行考量。
对试题进行区分度与相关性分析丨参考文献[7]
开发新题型:增加使用无正确答案题目和正态分布不会变的题目,可以比如测试短期记忆,测试的是在固定时间内人们能记住多少信息量。此类答案由考生自己生成的题目分数,即使平均水平提高了,但是分数分布还是会成正态分布。
缩短做题时间:间接增加了拿高分的难度。
分数合成方法的更新:最终的考试分数不按照直接相加法进行计算,而是按照不同题型的效度进行分数计算,比如单位加权法、多重分段法等。通过这种方法削弱可培训题目的最终占比,以减少培训对测试结果的影响。
参考其他考核标准:测试题不能全面概括一个人的能力,所以可以通过参考文章文采,口才,实习经历,面试表现等综合评价。
每个人都有不同的特质,想通过统一化的考试对一个人的整体特质进行评分是件挺难的事。近年来各个用人单位也注意到了这一点,尝试通过各种综合评价的方法提升考试的维度和效果。
不过,跳出考试本身,把逻辑题作为拓展思维的小训练,感觉也还挺有趣呢。
题目1题解:D,从数位特征分析,将每个四位数的前两位数字和后两位数字分别看成了一个两位数,这两个两位数的差依次是49-38=11,35-26=9,31-24=7,26-21=5,17-14=3。因此空缺项的千位和百位组成的数减去十位和个位组成的数所得的差应是1,选项D正确。
题目2题解:D,封闭区间个数由0递增,D有8个封闭区间。
题目3题解:A,每个图形里重复的图形递增,A有六个重复的“手机按钮”。
[1]刘永新.《行测速解技巧集萃》.人民日报出版社.2011.
[2]Baker, D. P., Eslinger, P. J., Benavides, M., Peters, E., Dieckmann, N. F., & Leon, J. (2015). The cognitive impact of the education revolution: A possible cause of the Flynn Effect on population IQ. Intelligence, 49, 144-158.
[3]Domino, G., & Domino, M. L. (2006). Psychological testing: An introduction. Cambridge University Press.
[4]Henderson, J. M., & Hayes, T. R. (2017). Meaning-based guidance of attention in scenes as revealed by meaning maps. Nature Human Behaviour, 1(10), 743-747.
[5]Kaplan, R. M., & Saccuzzo, D. P. (2017). Psychological testing: Principles, applications, and issues. Cengage Learning.
[6]Akella, Suresh, P. M. Diaz, and B. Suresh Babu. "Exam Results Fit to a Normal Distribution."
[7]江爱世,陈海平,丁玎,刘斯佳.北京市事业单位公开招聘考试改善探索与实践[J].中国人事科学,2021(04):17-24.