在加快教育强国建设背景下,学生综合素质评价是一个非常重要、必须及时解决的问题,而要解决好又有很大难度。
一、“唯分数论”背后是“活生生的人”的缺席
今天的学业水平考试、中考高考正在从知识点过关走向能力为重、素养立意,这不能不说是一种进步。但是无论纸笔测验怎么改进,它只是学生某些方面素质的反映,不能代表一切,更不能与活生生的人画等号。通过考试鉴别人的某些能力水平有赖于考试命题质量、组织实施及结果的科学解释,而人的政治信仰、道德品质、创新精神等能否通过纸笔测验、标准化考试来衡量,一个活生生的人特别是他的精神世界能否被精确量化,都始终是个悬念。
分数是抽象的,要真实把握某个特定分数的意义内涵,必须结合分数获得者的成长环境、学习经历等来分析。在优质教育资源条件下获得的60分,与教育资源相对薄弱条件下获得的60分,两者“含金量”不同,不能同等对待。而“唯分数论”就是一切用考试分数说话:一个分数决定了学生入学、就业机会乃至整个人生;一个班级平均分排名决定了教师职称;一所学校总成绩所处地位决定了学校获得资金投入的多少;一个城市的状元数量可以影响着城市教育的声誉……分数成了考核学生、教师、学校、地区的唯一依据,它的背后便会是同质化的加剧、精神世界的萎缩和倦怠、生命活力和创新精神的丧失,是活生生的人的严重缺席。如果评价孩子的方式总是只有一张试卷,如果孩子总是为考试而学习,那么这些孩子可能就会被禁锢在没有多大实际意义的刷题上,从小学一直刷到高中毕业,牺牲了生命中大把的美好时光,没有了好奇心、求知欲和想象力,丧失了人际交往、劳动实践和身体锻炼的机会,这是再残酷不过的。
值得注意的是,领导恢复全国统一高考的*同志在1978年召开的全国教育工作会议上的讲话中就曾指出:“考试是检查学习情况和教学效果的一种重要方法,如同检验产品质量是保证工厂生产水平的必要制度一样。当然也不能迷信考试,把它当作检查学习效果的唯一方法,并且要认真研究、试验,改进考试的内容和形式,使它的作用完善起来。”[1]“唯分数论”也背离了恢复全国统一高考的初衷。
二、综合评价录取的破冰之旅
如果重点学校、热门专业招生以分取人,那么不少地区和中小学校的素质教育就难免实施不到位。当学校的入口和出口都太“死”,只看考试分数,就会导致培养方式死板,大面积的教育教学“活”不起来,少数有教育情怀的人花费很大气力也只是精心打造出若干“盆景”,寄托着人们对美好教育的向往。
正是基于上述原因,2014年考试招生制度改革启动,注重从服务科学选才的角度,对自20世纪80年代孕育并逐步建立起来的学生综合素质评价制度进行总结梳理和完善。2014年,教育部发布《关于加强和改进普通高中学生综合素质评价的意见》,强调“坚持客观性,如实记录学生成长过程中的突出表现,真实反映学生的发展状况,以事实为依据进行评价。坚持公正性,严格规范评价程序,强化有效监督,确保评价过程公开透明”,明确写实记录、整理遴选、公示审核、形成档案等工作程序,以省(区、市)为单位建立综合素质评价工作电子化管理平台,建立健全公示制度、检查制度、申诉与复议制度、诚信责任追究制度,这些都重在为招生录取、用人单位提供服务。
时至今日,各地全面落实新时代教育评价总体要求,在健全综合评价方面普遍建立省级统一的综合素质评价信息管理系统,完善工作程序,强化公示审核。抽样调查表明,80.8%的初中教师、61.5%的初中生、71.1%的高中教师和66.1%的高中生都参与了综合素质档案的填写,还有约两成的家长、学校管理者以及教育主管部门参与其中。多元化主体参与既能丰富学生的活动记录和事实材料,全面呈现学生成长过程,也能起到多方印证的作用。调查还发现,67.6%的初中生和66.7%的初中教师、56.5%的高中生和73.5%的高中教师指出,学生综合素质档案填写时间主要在每学期末,过去在毕业学年突击填写的状况有所扭转;约85%的初中和80%的高中建立了基本的监督保障制度,包括定期公示、相关部门不定期抽查、对有问题档案材料检举等[2]。
约80%的高校制定了综合素质档案使用办法,并探索将评价结果在强基计划、综合评价录取等招生工作中使用,如作为面试评分的参考、专业调剂的依据等,推动“教考招”联动、同时发力,实现高考的终结性评价与基础教育阶段的过程性评价相结合的转变,为破除“唯分数论”做了积极努力。复旦大学在试点期间严密组织面试,规定由250—300名在复旦大学工作6年以上的正教授参与。根据生源情况,在考虑面试经验、学科等因素后由电脑随机派位分组,专家分成50—60个小组,每组5位专家独立评判打分。专家面试参考高中生综合素质档案,作为录取依据的综合总分由三部分组成,其中高考成绩占60%,面试成绩占30%,高中学业水平考试成绩占10%。该模式打破仅凭一次考试分数录取的模式[3]。近年来,清华大学丘成桐数学科学领军人才培养计划由高校自主选拔;北京大学等高校还举办了数学、物理英才班,探索基于统一高考的自主选拔,综合评价录取方式越来越多样化。在普通高中招生方面,浙江嘉兴、山东潍坊、湖南长沙等地都进行了综合评价录取的实践探索。这些探索在全国来说虽然规模不大,但具有引领意义;也许还存在某些缺陷,但有着敢于担当的勇气、胆识,他们是可贵的破冰者。
世界各地的本科院校招生模式大致有三种:一是公式化录取,以一次性标准化考试成绩为依据,用一把尺子衡量千差万别的考生,虽然可操作性强、效率高,公众接受度也比较高,但对人的个性尊重不足,与创新型人才培养的时代要求不相适应;二是公开抽签录取,就是在一定标准基础上符合条件的申请者公开抽签决定,这种模式还有赖于入学之后必要的淘汰制度的建立,或者根据不同的学业完成情况授予不同的文凭;三是综合评价录取,强调将学业与非学业因素结合起来进行个性化选拔,这种模式有利于选拔与教育理念、培养目标相匹配的学生,但容易因某些个别事件受到公平性等方面的质疑,尽管多方面追踪研究发现采取综合评价招录的学生后续发展整体优于公式化录取的学生[4]。在人才选拔问题上,恐怕没有完美无缺的方式方法,但基于未来社会创新型人才培养的需求,我们应适时加大综合评价录取力度,并强化相关制度建设,以引导学生、教师、家长和社会更加关注单纯纸笔考试难以测评的社会责任感、创新精神和实践能力的培养。高利害的招生改革确实可能带来弄虚作假等问题,把综合素质评价难题推向社会很容易,但如果等待社会环境完善特别是诚信机制建成后再去实施,可能错失良机。诚信机制是在综合评价录取过程中逐步建立的。
三、转向发展性评价
发展性评价与选拔性评价因为目的宗旨不同,在思路、方式及相关要求上有着本质差异:前者的主要用户是学校师生,它着眼于学生发展,注重评价的诊断、激励功能,它嵌入教育活动过程,本质上是评价双方的对话、交流,它要求动态生成评价的具体内容、标准,提升评价双方的自我反思意识和自我教育能力;后者的主要用户是招生部门,它为选拔合适新生服务,注重个体间差异的甄别、排序,淘汰不合格的申请者,它强调指标的统一,评价的客观可信、公平公正。相比较而言,发展性评价更为基本、普遍,也更加重要,更需要加强,它是评价的本体性功能,而“选拔性功能是在升学考试、各类竞赛中体现的,是评价的附加功能”[5]。这样说并不否定两者之间的关联。
发展性评价是人们根据自己设定并致力于达到的标准来评估自己的表现,而不是被动听随他人或技术的评判;评价者一般不是对他人表现进行直接评判,而是善于启发评价对象就有关表现发表自己的意见,用支持自主的方式提出批评或建议;不是把评估结果当作批评依据,而是将它看作需要解决的问题。
在综合素质发展性评价方面,面广量大的中小学进行了丰富多样的实践探索,积累了大量鲜活的经验,但总体上看有些问题值得深入研究。如基于综合素质的若干维度逐层向下分解考查点,形成几十个甚至上百个考查点,然后将各考查点简单合成一个等级或分数,这样的肢解、合成不仅存在科学性问题,而且不足以发挥应有的诊断引导作用。“综合”不是肢解基础上的集合,综合素质评价要求面向整体的人,通过复杂情境中解决问题的综合表现集中反映人的整体素质状况。对成长中的孩子综合素质打等级尤应慎重。我们不能仅从服务招生的角度“做档案”(高校综合评价录取也不能仅从统一的综合素质评价电子化管理平台上获取信息),而应转向发展性评价,侧重从促进学生发展的角度调整现行学生综合素质评价的思路、方法,为学生全面发展、健康成长建立成长反馈调节机制。
在我国,学生的德智体美劳全面发展主要是由一套完整的课程体系加以保证的。基础教育课程体系对学生学习的领域、目标、内容、方式等做了系统设计,明确学生为何学、学什么和学到什么程度。《义务教育课程方案和课程标准(2022年版)》和《普通高中课程方案和语文等学科课程标准(2017年版2020年修订)》基于培养目标和学科特点,凝练了每门课程应着力培养的核心素养,对知识与技能、过程与方法、情感态度与价值观三维目标做了整合,围绕核心素养的落实精选、*课程内容,研制了学业质量标准。在新课程实施背景下,应调整这种做法:把各学科课程窄化为智育、把学业水平成绩窄化为纸笔考试分数,在各门课程之外另搞一套关于思想品德、身心健康、艺术素养、劳动与社会实践的分级指标体系。要注重综合素质评价与核心素养导向的课程对接,全面关注学生各门课程的学习情况,指导学生对课程学习情况进行写实记录、分析与改进,特别是标准化考试、纸笔测验不足以反映的学科实践和跨学科实践经历,如普通高中课程方案明确规定的2个课题或项目的研究性学习、不少于40小时的志愿服务经历、校本课程修习情况,有关课程标准规定的野外考察、实验探究、项目设计与制作情况等,建立健全课程实施的评价机制,促使核心素养导向的课程真正落地。
发展性评价的必要前提是探索建立对学习行为与发展起制约作用的潜在素养结构及其进阶水平,明确各进阶水平的关键表现。如果不能清晰地定义素养外化的表现性目标,我们就不知道如何选择、排序和呈现学习内容,如何激发和保持学习者的动机、兴趣,也无法克服学校长期以来存在的比较突出的三个问题:(1)离散的、超负荷的目标内容;(2)由灌输和离散的(而非正向迁移的)练习组成的教学;(3)脱离情境的对“某一部分”的分散学习。发展进阶水平的刻画,既不是聚焦知识技能,也不是只给出最终的关键表现,而是要把学生到达最终目标的若干必须经过的台阶明确勾画出来,构成发展性量规。如健康领域的发展性评价需要围绕健康生活等关键行为明确学习进阶:从尝试健康生活新体验并感受尝试结果,能够把自己的不舒服告诉别人;到设定健康生活的某一个方面的目标,据此自我监测、反思、改进不健康行为,并为自己喜欢的活动留出时间;再到确定个人健康生活的整体性目标,自我监测,识别不健康的影响因素并避免之,优化健康行动等,给出健康生活习惯、品质形成的清晰可见的梯度,成为具有连贯、整合性质的教学和评价活动的指引。发展性量规不是“天花板”,而是“登天”的阶梯。
发展性评价的落脚点是促进学生的自我评价、自我教育。学校应切实关注学生多样化成长需求,创设个性化展示平台,引导学生结合学校培养目标和时代需要,不断思考“我将成为什么样的人”,给自己的未来画像并以终为始,规划自己的阶段性目标、任务,记录完成任务的过程、表现及内在体验,用证据说明自己发展到了什么进阶水平,不断发现自己的潜能,激发内在成长动力,进一步明确生涯规划和发展愿景。有研究者“对过去30年128项实验研究进行了审慎研究,得出结论:外部奖励削弱了内在动机”[6]。真正的问题不是如何激励他人,而是创造怎样的条件让人激励自己。我们可以组织学生之间、亲子之间、师生之间敞开心扉交流彼此看法和建议,促进共同成长;也可以利用物联网、互联网、穿戴设备等信息科技手段自动收集、汇总、整理有关学生学习和活动过程信息,及时反馈给每一位学生。多样化方式、手段的运用是为了给学生提供必要的反馈信息,这些信息可能是学生自我认识中的盲点,但是这些信息不能替代学生主动的体验感悟、分析判断和选择,不能替代学生的自我规划、自我总结反思和自我教育。亲子之间、师生之间的互动评价不能演变为成年人对未成年人的单向度考核,让学生时刻处于被动接受评价的状况;信息科技手段的运用不能演变为全方位的监控,制造完全“透明”的教室、操场、食堂,无限制向儿童活动的所有时空延伸,无视儿童的隐私和人格尊严。
综合素质评价重要,但并不意味着我们可以频繁、全方位地进行各种各样的考评;技术便利,也并不意味着我们可以在孩子身上、在可能性的边缘无限度地试探。评价者在任何时候都不应该忘记,要让评价成为真正的教育。
(柳夕浪 作者系中国教育学会学术委员)
注释:
[1] *. 在全国教育工作会议上的讲话[M]. 中国教育年鉴1949—1981,北京:中国大百科全书出版社,1984:61.
[2] 山东师范大学教育学部. 中学生综合素质档案建设及使用建议(教育部综改司委托项目内部资料)2022. 10.
[3] 丁光宏等. 复旦大学综合评价自主选拔录取改革的探索与实践[J]. 中国考试,2017(4).
[4] 董秀华. 综合素质评价:政策、理论与实践[M]. 上海:华东师范大学出版社,2022:106-107.
[5] 柳夕浪. 撬动未来的杠杆——学生综合素质评价改革研究[M]. 杭州:浙江教育出版社,2021:113.
[6] 德西等. 内在动机[M]. 王正林译. 北京:机械工业出版社,2021:序言.
《人民教育》2023年第20期
作者:柳夕浪