第二届语言测试与评价国际研讨会日前在浙江大学举办,会上流出的一个重大消息给未来的语言培训行业带来一丝变化:教育部正在组织研制中国英语能力等级量表,与之配套的,还有国家英语能力等级考试。这意味着,我国将建立起一个统一的外语测评体系。
根据教育部网站的消息,这个能力标准研制已经初步完成,考试研制也已经取得显著成果。根据现有安排,预计到 2017 年,中国英语能力等级量表将正式对外公布;2020 年,国家将基本建成标准统一、功能多元的现代外语能力测评体系。
2014 年发布的外语能力测评体系
既然国内已经有诸如大学英语四六级这样的普适性考试,为什么要从国家层面推出一个外语能力测评体系呢?距离 2020 年还有不到四年时间,这四年里,语言培训行业可能迎来怎样的革新?
不论是国内的中高考、考研考博、专四专八及各种社会化考试,还是国际流行的托福、雅思、GRE、PTE.......各种类型的英语水平考试五花八门,语言培训市场也因此被带的火热(根据互联网教育研究院的研究数据,这个市场的规模大概在 900 亿左右)。不论是升学还是就业,大量考试的存在,说明英语水平的认定需求从来就有。但是也正是因为这些考试的存在,导致市场缺乏统一标准,各个级别之间的英语水平无法匹配。
有业内人士告诉 36 氪,关于建立统一的英语考试测评标准,新东方很早之前就曾尝试过,但是标准的建立需要专家、学者、学术单位、培训机构等不同方共同参与,这件事最后以失败告终。那么国际上是否有成形标准呢?
2001 年,欧洲委员会曾经通过了一套建议标准,用来评估语言学习者在在所学语言的成就,同为为教学、考试、教材的评量架构提供了一个基准,这就是欧洲共同语言参考标准(英文简称 CEFR)。这套标准共分为C2、C1、B2、B1、A2、A1 留个标准,有专门的机构负责相关语言测试,该机构所颁发的语言证书已经在全欧洲获得了承认。
很长一段时间,中国的学者都提出了将 CEFR 引进来,但是受到教育传统、语言学习环境和教学实践的制约,CEFR 并没有对中国的英语教育实践产生实质影响。51Talk 的副总裁、教研负责人戴云也向 36 氪表示,CEFR 毕竟是欧洲标准,不太贴切中国的英语学习者,因此无法直接应用到中国,中国需要一套自己的标准。
与国外著名量表及考试的对接
即便是作为国内参与人数最多的考试,大学英语四六级也没能成为“中国的 CEFR”,四六级证书的作用也更多地体现在高校内。复旦大学外文学院的蔡基刚教授曾表示,这是因为“四级证书只能证明学生有四级这个级别,只能测试他们的英语能力达到了某个测试目标(比如 4500 个的词汇量),但并不能说明学生已经能自如地运用英语了”。华东师范大学外语学院英语系的邹为诚教授也表示,四六级常常被诟病考试内容实用性不够,最能证明应用能力的口语考试也只有高分者才能报考,因此“四六级考试和社会需求基本是脱节的”。
另一个现状是,美国、英国都有各种各样社会化英语考试,即便内容不同,这些考试分数之间也能互相转换(由 ETS 美国教育考试服务中心官方给出换算标准)。加上这类考试的标准化程度较高,可以受到不同学术单位和企业的认可。但是中国的中高考、四六级、PETS 等考试并不存在换算标准,标准化程度较弱,所以中国的英语学习者往往参加了不计其数的英语考试,结果都被浪费掉了。
总的来说,戴云认为:CEFR 在国内没有完全对标,国内的考试“不科学、不系统、不严谨”,缺乏社会化运作,因此建立能力测评体系很有必要。
2014 年 9 月,国务院发布了《关于深化考试招生制度改革的实施意见》的文章,明确要从改进招生计划分配方式、改革考试形式和内容、改革招生录取机制等几个方面入手,到 2020 年为止基本建立中国特色现代教育考试招生制度。关于外语能力测评体系方面的建设,则是:
在建立国家外语测评标准的基础上,推动考试内容和形式的改革,实现国家英语能力等级考试与现有外语考试的衔接或整合,初步完成国家英语能力等级考试、中国英语能力等级量表与国际知名英语考试、国外知名语言量表的对接研究、完善开发系统性的考试项目,推动形成性评价与终结性评价结合的研究。
前面说到,外语能力测评体的建立并不是一个简单的过程,它需要专家、学者、学术单位、培训机构等不同方共同参与。从 2014 年发展至今,教育部副部长林蕙青表示,目前中国英语能力等级量表已完成主体研制,计划明年对外公布。广东外语外贸大学副校长刘建达教授在会上透露,这个标准将把中国人的英语水平划分为九个等级:其中,一二级大致对应小学水平,三级对应初中,四级对应高中,五六级对应大学,七级对应英语专业,八九级对应高端外语人才。每个等级在听说读写、翻译、知识策略等方面,都有不同的要求。
而与之对应的能力等级考试也正在研发中,这个等级考试的建立将增强主要教育阶段英语考试的科学性、体系性、选择性,为学生外语能力的发展提供一个连贯有序的阶梯,相关计划将在 2020 年前逐步推出。
而落地最快的方案,就是对高考外语科目的改革。2016 年的高考已经有 26 个省份使用全国统一命题的英语试卷,考试内容更注重基础性、综合性、应用性和创新性,除了笔试外还增添了听说方面的测试。而英语高考也将从统一的国家性考试改为社会化考试,浙江省更是开始了“一年两考”的制度,考试时间分别在每年的 1 月和 10 月,学生可以选择其中较好的一次成绩计入高考总分。另外,外语标准化考试题库和标准化考场也正在建设中。
毋庸置疑的是,高考英语科目是整个测评体系中的重要内容,能力量表和考试质量标准的建立,都将为高考改革服务,而高考改革的推进也将为评价体系的落地奠定基础。
有参与该国际研讨会的的专家(根据采访者要求匿名)表示,因为有国家层面的推动,只要“量表”制定好,落地一定不是问题,但关键是如何让量表更加科学。一个很简单的例子是,会上有专家在判定较高级的英文写作水平时,给出的描述是“高级别的学习者能在教师帮助下写英文诗歌”,但有很多人反应说很多高中生就已经具备了这种能力。所以让量表更科学,细节的界定是一大关。尽管一到九级已经有了粗浅的描述,但是背后还有很多 can-do list 需要商榷。
但是最终,外语能力测评体系还将从行业层面的落地到学生个人身上。戴云认为,评价体系将为学生带来更灵活的学习安排,比如一个初中生通过测试后发现自己的英语水平已经大学级别,就能把学习重心放在更多专业课程上;或者一个刚入校的大学生通过了毕业时的水平要求,就可以在大学四年内专注在别的事情上。更理想的情况是,如果这个体系的测评结果和雅思一样有 2 年有效期,会给学生带来更多自主权,“一考定终生”的局面也就不复存在了。
不论是教育内容、课程服务还是测评体系,大大小小的机构都会随着测评体系的发布改变策略。36 氪采访了多位行业内人士,从业者们普遍认为,建立标准化是一件好事。
为了推进体系落地,国家层面的需求是什么呢?
在国际研讨会上,林蕙青表示,因为全球化背景下对创新人才的需求,对外语能力测评体系建设提出了更高要求。她表示,未来工作将围绕三个层面展开:1)统筹协调教学、考试、招生改革的关系,提升人才培养和选拔质量;2)创新测评技术,推进教育现代化;3)加强开放共享,推动国际间深度合作。
有专家告诉 36 氪,根据会上讨论的结果,这些要求的实施和落地,可能会让语言培训行业“重新洗牌”,因为教学目标、教学资源的组织、教学方式等各方面都会发生改变,这种改变将是“牵一发而动全身”的。
在这个要求下,对那些提供课程和服务的公司来说,意味着机会,也意味着挑战。
51Talk 的戴云认为,考试机构本身是一个极大的市场,分级测试的存在就意味着培训的刚需。如果有社会化的考试机构专一地做这件事,几年内语培行业的内容服务一定会随之发生改变:这些机构的专业性会更强,也可能会有大的巨头出现。
但是从另一个层面来讲,专业性就以为着培训广度的收窄,以前英语行业的培训内容可以从少儿英语、学科英语一直覆盖到中高考、四六级,多种类就意味着高营收。但是从国家层面制定的能力量表和考试会打破之前的培训生态,可能会减少英语学习者多样化的培训需求,因此行业竞争将加剧。
既然是量表的制定是一个测评的过程,技术会从中起什么样的作用呢?驰声科技的 CEO 林远东向 36 氪表示,这一系列技术标准的制定对技术公司来说有很多行动和指导意义。一个现状是,因为语言考试种类繁多,国家并不缺乏任何定性的标准,但是任何定性标准如果要有生命力,就一定要定量、要有标准化。而人工智能作为一种定量的计算方式,如果能应用在这件事上,就能让测评效率得到大幅提升。而这也解释了为什么大学英语四六级的口语考试始终影响力不大:因为需要大量人力,举办这样规模的考试难度很高。
但不论中国英语能力等级量表和考试要以怎样的方式落地,确定的是,它都将为语言培训行业带来一次大的变革,甚至是新一轮“洗牌”,而洗牌背后也将是升学考试、到人才选拔的变化。但标准化的利好在于会让行业的竞争从无序走向有序。从 14 年国家发布实施改革意见起,初见成效的虽然只有高考一项,但是如果从小学阶段就开始制定规范,行业就会减少很多无用的投入,降低风险,转而考虑一件事,就是如何从考试着手,应对不同等级标准下带来的机会。