编者按:本文来自微信公众号“哈佛商业评论”(ID:hbrchinese),作者:HBR-China,36氪经授权发布。
人类大脑是一个分类机器,一刻不停地吸收外界海量的混乱数据,将其简化和格式化处理,以便理解这个世界。这是大脑最重要的能力之一:一眼看出某个东西到底是蛇还是木棍,对人类来说很有价值。
分类法有价值的前提是两点:第一,必须实事求是。你不能随意地将同类强行分开。正如柏拉图所说,有效分类是“从关节处切分种类”,就像蛇和木棍。第二,必须有用。不同类别必须有你所关心的差异。区分蛇和木棍是有意义的,能帮助人类在丛林探险中存活下来。
但在商业世界中,我们常常创造并依赖一些虚假或者无用的分类,这会导致重大的决策失误。
分类思维的危害体现在四个重要方面。它会脸谱化同类别下的成员,忽略彼此间的差异;夸大不同类别成员的差异;歧视、偏爱某些类别;将人为制造的类别构架视为恒定不变。
我们在分类时,依据的是原型。这样一来很容易忘记每个类别中的各种变数。
目标客户的迷思。营销部门最常用的工具之一就是研究细分市场,旨在将顾客分类,找到公司的目标客户群——也就是公司的战略重点和需要特殊关注的一类客户。
细分用户研究一般先询问顾客的行为、意愿和人口统计特征,再根据答案的相似程度,通过聚类算法将答题者分为不同类别。这类分析很少得出差异很大的类别。但营销人员很少会认真评估这些群体是否真实存在,而是直接进入细分流程的下一步:确定平均值、顾客画像、创造原型。
屏蔽效应。脸谱化还会影响人才选拔。假如你负责公司招聘,在贴出广告后,有20人应聘。你先做一轮筛查,然后根据候选人的技术能力进行排名,选择前5名来面试。
即便这5个人的技术能力大相径庭,但到了这时也不会太多影响你的录用决定。一旦你基于技术能力筛选出候选人,进入下一阶段的候选人在你眼中技术能力都差不多。受到分类思维影响,你在面试中会主要基于软技能进行筛选:他们的气质谈吐如何,沟通是否高效等。当然这些技能很重要,但对很多职位来说,最重要的是找到技术能力最高者,但屏蔽效应妨碍了你找到这些人才的能力。
分类思维会促使你夸大不同类别间的区别,对其他群组的人产生刻板印象,在决策中随意设立阈值,得出错误结论。
群组动态。在大数据和用户画像时代,基于分类思维产生的夸大令人担忧。例如,Facebook根据用户浏览记录(“中立”“保守” “自由”),为其打上政治标签,并为广告主提供这类信息。这会让广告主觉得Facebook不同类型用户间的区别比实际要大,而讽刺的是,广告主因此为每个群体量身打造广告内容,反而会进一步扩大真实差异。2016年美国总统大选和英国脱欧政治活动中,似乎就发生了这样的情况:Facebook为“保守派”和“自由派”用户提供了数千条加深分裂的内容。
很多公司的内部也饱受类似的夸大效应之苦。不同部门发挥协同效应往往会给企业带来成功。但是分类思维会让人严重低估团队跨部门合作的成效。如果你觉得公司的数据科学家很懂技术,但是对商业运作一窍不通,公司营销经理很懂营销,但面对数据一筹莫展,也许你根本不会想要让他们合作。这也是很多分析项目停摆的原因之一。
决策。夸大也会以不易察觉的方式影响管理决策。例如,NBA球队在以微弱比分输掉比赛后(100比101),相比以微弱比分赢得比赛(100比99),即使都是两分之差,教练在下一场比赛中,调整首发阵容的概率高17%。但很少有教练会因为球队以100比106,而不是100比108输掉比赛,而调整阵容,虽然差距也是两分。失败和成功从感觉上讲有本质差别,因为人们不会以连续统一体看待体育比赛结果。
统计显著性。随着行为经济学和数据科学的兴起,企业日益依赖A/B测试来评估效能。部分原因是A/B测试易于执行和分析:你创造出除一个因素外其余完全相同的两种情况,然后让一组人体验A版本,再让另一组体验B版本,接着看两组间是否有较大行为差异。即便这一设计实则毫无作用,出于偶然性,两组之间总会有某些差异。因此,为了确定差距是不是足以说明测试设计有效,还要做统计测试。测试结果就是在假设控制因素无效的情况下,你可能会看到差距差异的可能性,即假设概率(p值)。该值越接近0,越能充分说明你所控制的因素才是差异的主要原因,而非偶然性。但多接近0是足够接近呢?
1925年,英国统计学家和遗传学家罗纳德·费希尔(Ronald Fisher)爵士随意选择了0.05作为分界。他也可以挑0.03,实际上他还建议,假设概率应当根据研究参数的不同设置不同值,但没人在乎。在随后几十年间,学界盲目追随,认定0.05是划分有效与否的楚河汉界,并成为商业实践的规范。
这带来各种问题。当A/B测试出现0.04的假设概率时,测验通过,而0.06则放弃,但从这数字本身来说,两者之间差异并无太大意义。更糟的是,很多实验人员会定期偷看数据,测试统计显著性,当看到低于0.05的假设概率后,就不再搜集数据。这样做,更容易将实际无效的介入视为有效。近期,针对使用著名网上A/B测试平台的实验人员,有人进行了研究,发现多数人参与了“假设概率造假”行为,导致虚假测试率从33%上升到42%。
一旦你采用了某种分类体系,会倾向于更偏爱某些类别。但是,忽视另一些类别会带来有害结果。
过度定位。广告对目标客户也许有更大的积极影响,但在很多情况下,广告主无法收回每次点击多花费的成本。然而营销人员沉迷于目标客户,忽略了其他人身上的价值。
Facebook一直在致力于帮助广告客户理解与细分客户相关的覆盖率问题。它以一个曾关注男性用户的啤酒品牌为例。该品牌转向数字媒体后,能够缩小目标客户的范围,看似是件好事。但实际上,这严重限制了公司宣传的覆盖范围,品牌绩效下滑。调查过后,公司发现该品牌的消费者很大比例是女性。在拓宽目标范围并推出创意广告后,公司立即看到好的变化。
净推荐值。什么是净推荐值(NPS),它的作用是什么?——企业询问顾客(或员工),以0到10的标准,他们向亲朋好友推荐这家公司的可能性有多高。0代表“绝不会”,10代表“肯定会”。在给出答案后,消费者会被分为三类:批评者(0-6分),被动者(7-8分)和推荐者(9-10)。得出NPS值,先要统计各类顾客的比例,然后用推荐者比例减去批评者比例。如果60%的顾客是推荐者,10%的顾客是批评者,你的NPS是50。
NPS体系本应帮公司避免夸大和偏见,但其本身也存在同样问题。例如,打6分的顾客更接近7分而不是0分,但它还是被归入批评者,而非被动者。决定分数时,跨类别的微小差异起了重要作用,换言之,同一类别中相同的,甚至更大的差异反而被忽略。
NPS还有另一个分类思维的问题:被动者的数量不予统计。以两个极端调研结果为例:一家公司有0%的批评者,0%的推荐者。另一家有50%的批评者和50%的推荐者。两家NPS值相同,但很明显两者的顾客状况非常不同,应当用不同的方式进行管理。
分类会导致僵化的世界观。它让我们觉得这样看到的就是真实的世界,而不是一部分人梳理世界的一种方式。约翰·凯恩斯(John Maynard Keynes)曾用精妙语言描述过这一观点,“困难不在于如何接受新思想,而在于如何摆脱旧思想”。
很多企业希望通过分类提高运营效率。他们将任务分配到人,将人分配到各部门等等。
这么做有其意义,但也会付出代价。为解决过去业务问题所作的分类,难以适应未来的问题。而依靠分类来思考问题,会给知识创造拖后腿,因为它会影响人们以全新方式结合各因素的能力。2016年,多伦多大学的研究人员进行了一项研究,要求200名参与者用乐高积木搭建一个外星人。他们要求部分参与者使用分好类的积木,另外一组则使用随机分类的积木。第三组人就方案的创造性打分,结果使用未分类积木的小组,被认为更有创意。
如果类别僵化,还会让人觉得很难跳出规则使用物件(或想法),从而影响创新。这是功能固着性的问题。
分类帮助我们理解世界,和他人沟通。但我们已经发展成为分类机器,以至于在没有类别的地方也看到类别,这会扭曲我们的世界观,给决策带来不良影响。过去,这样的影响也许不至于使公司陷入危机。但今天,随着数据革命的发展,成功的关键就是降低分类思维带来的不良后果。
巴特·德朗格(Bart de Langhe)菲利普·菲恩巴赫(Philip Fernbach) | 文
巴特·德朗格是位于巴塞罗那的拉曼鲁尔大学的ESADE商学院营销学教授。菲利普·菲恩巴赫是科罗拉多大学波德分校利兹商学院营销学教授,合著有《知识错觉:为什么我们从未独自思考》(The Knowledge Illusion: Why We Never Think Alone)(河源出版社,2017年出版)。
牛文静 | 译 时青靖 | 校 刘铮筝| 编辑