高等教育绩效评估问题分析

时间:2022-04-28 09:22:11

导语:高等教育绩效评估问题分析一文来源于网友上传,不代表本站观点,若需要原创文章可咨询客服老师,欢迎参考。

高等教育绩效评估问题分析

一、高等教育绩效评估面临的困境

(一)高等教育机构是生产多种“产品”的组织

高校生产“产品”的多样性是评估高等教育产出的主要障碍之一。高等教育产出的范围和性质决定了较其他大多数产业在绩效评估上具有更大的复杂性。有学者指出“测量教育产出确实非常困难……教育中最根本的一些困难如考试成绩、班级规模以及类似的属性至今没有得到深入的讨论,虽然这些相关问题的测量是值得关注的。更重要的是,因为他们是多元产出的组织,他们不只是产生唯一的教育,他们也生产其他产品”[2]。大型研究型大学培养本科生,提供专业性及研究生学位,参与公共服务活动和研究,创造文化等等。高职学院和一些地方院校,为直接就业的毕业生提供职业证书,为考入研究型大学的学生设计学位课程,为满足当地劳动力市场和特定雇主需求设置专业课程。面对这些任务,开发能囊括各种不同类型大学的所有产出增值的财会体系是非常困难的。许多专家对如何改善大学投入和产出的测量提出了很多建设性建议,但仍有一个难题无法解决。研究及其他学术创新性活动作为大学联合生产的一部分应该被纳入绩效综合核算。然而联合生产带来的分析问题的困难在于如何从学位生产成本中将研究开发生产成本分离出来;如何比较研究与学位产出的相对价值;如何分配教职员工在每项任务上的时间投入。在区分高等教育产品功能的教育与非教育成分的过程中必须做出判断是件困难的事情。同时,大学具有提升大学毕业生的社会责任感和未来职业责任感等精神境界的任务。然而如何测量确实仍未找到合适的工具。

(二)高等教育的非市场性和外在效应

非市场性进一步使计算高等教育的投入与产出比复杂化。学生的时间和学校非金钱收益等因素,不能买卖,不能轻易用货币衡量。此外,并不是受教育的公民的全部利益都能转化为为教育付出的人的利益。这样的特点就使得这些因素很难测量。因此,在生产率测量中这些因素会经常被省略掉。那些关心国家在教育上投资回报的政策制定者应该对院校为个人和社会创造的全部价值感兴趣。这些社会价值大多是无形易变的,例如,就同辈影响而言,寄宿院校要比走读院校创造更多的社会资本。尽管上述社会价值不能被准确地测量,但是这种非市场性维度无疑是高等教育功能的重要组成部分。这通常也是高等教育作为一项优先的公共支出项目的原因之一。高等教育创造的积极外在效应被认为是刻意地将学费都制定得低于市场均衡价格。国家给予院校多种形式的定量配给和补贴以满足特殊行业的需求,如国防生、免费师范生。经济补助和其他形式的交叉补贴可以使院校增加录取弱势学生群体的人数。这种非市场指导的价格导致最终的边际成本与价格不一致,总收入不能与院校产出相等;不同活动收入的分配也不能被用来建构反映相关消费者价值产出的总指数。有学者为了避免测量产出存在的问题,假设教育价值与学生将来收入贴现价值相等。他们基于毕业生终身收入评价教育对人力资本的贡献[3]。然而除去其他假设,这种测量不能简单回归到一个具体的教育片断,对成果的关注可能包含教育作为区分不同能力个体的筛选机制的角色。这就潜在地夸大了教育的贡献。

(三)高等教育中投入异质性

异质性是指具有不同产出的院校组织功能具有不同的特点。影响质量的因素几乎寓于高等教育投入的各个方面。这种复杂数据和分析需要精确和灵敏的质量测量,需要长期研究调查。高等教育生产率的全面具体的测量将会解释质量随时间的变化以及个体、院校在投入和产出的质量变量。鉴于学生和教师的天赋不同,他们学与教的准备和有效性也就不同。很显然,高职院校、普通大学和重点大学的学生存在明显差异,师资条件也不同。1.学生因素对绩效评估的影响。学生群体以下因素明显地对教育投入与产出之间的关系产生影响:(1)家庭经济地位的不同。(2)学生高中知识基础的不同。(3)学生学习性投入。学生动机和能力变量强烈地影响学习过程及效率。(4)同辈影响。学生互动影响高等教育的投入和产出。如果准备较差的学生能受到周围准备较好的学生熏陶,提高学习成绩,那么这种提高也是高等教育体验价值的一部分。一般来说,院校学生群体的构成将影响院校绩效测量的得分。如果测量的标准是毕业成果的话,学生的低水平学术程度将转化成低生产率。如果考量的是附加值或者边际效益,知识基础较低的学生可能导致高生产效率,因为可弥合的学习差距大。近年来,国内学者引入了学生学习性投入测量,其优势在于可以洞察指定院校学生的体验。这种方式日渐重要,因为学生为教育活动投入努力的程度是学习过程的一个至关重要的因素。学生投入性的测量在了解院校对学生学习和自身发展方面的影响是有益的。即使如此,学生学习性投入测量调查仍有其局限性。首先,有关学生投入度的调查更多地关注学生学习性投入,但是当涉及学生持有率和满意度的相关问题时,社会投入性的数据同样很重要[4]。其次,任何有关学生特点的测量都必须记住就质量测量方面院校之间的方差总是小于院校内部的方差。这是因为院校内部学生个体的表现总是比院校之间平均表现具有更多的变化。这适用于每一个层次的教育。NSSE对大学一年级和四年级学生做的14个测量指标中,除了一个指标之外,院校之间的学生学习性投入的方差都不足总方差的10%,而在学院或者大学内的学生中剩余的方差超过95%[5]。因此,只在一个学院机构层面测量质量在估计生产率时可能会产生误导。2.教师因素对绩效评估的影响。大学教师可以简单地分为两类:教授和助教、讲师。教授承担教学、科研和公共服务。一般来说,在研究型大学,教授的主要时间显然要用于研究;而高职学院,主要精力要用于教学。在动力和能力方面,助教、讲师与教授相比孰优孰劣是一个经验问题。正是这些问题突出了更合理的绩效测量的必要性。不同情况下,得到的答案也会不同:在某些情况下,研究和行政责任可能改进教学质量;在其他情况下,学术成果发表的压力会促使教授不关注教学质量,忽略教学。在所有类型的院校中,助教、讲师几乎都会被安排教授具体课程,研究型大学中助教、讲师还会承担科研任务。如上所述,科研创新性很难被测量。因此,有必要分析教授和助教、讲师的授课质量。就具体授课的质量来讲,助教、讲师和教授可能具有相同的质量。教师质量通常依据成绩和学生评价来测量。然而,这些结果可能会严重地受到外部因素的影响,因此院校很难弄清楚教师质量对学生成功的贡献。在一项控制研究中,将大学生随意分配给终身教师或者兼职教师,分析学生课程分数评估教师质量。研究发现,兼职教师(更具体地说,没有获得最终学位,缺乏经验的教师)教授的学生在较低级别的课程(微积分1)所取得的成绩更好。然而,高级课程评估结果就截然相反了(微积分2)。兼职教师更可能通过教授入门级课程从而提高学生考试成绩,但终身教师更可能提升学生对知识的理解[6]。即使研究提供了测量教师质量的有用方向,但不可能使所有的大学和学院进行这样的可控制的研究,如此丰富的数据用于分析还不是很容易获得。

(四)高等教育产出的异质性

高等教育产出方面,高校颁发不同级别和学科的学位。这些不同,影响了教育过程和毕业生劳动力市场的价值。院校服务多样的学生群体追求不同的使命。虽然大学都致力于培养受过良好教育的合格公民,事实上,一些院校仅仅提供四年制本科的学位证书,一些院校努力培养学生有能力考入研究型大学,高职院校培养学生的职业技能,其他一些研究型大学提供不同学科领域学士和研究生学位。一些产出注定比其他产出昂贵,然而由于异质性,人们无法判断哪种更优。理想化来说,衡量高等教育的产出价值,需要识别质量维度,整合相关的学习、课程预备、就业准备和收入效益等相关指标。即使信息全面,衡量这些特点还是需要主观评价。我们强调用清晰无误的定量质量指标定义高等教育产出在现阶段是不可行的。尽管大学通常使用学分作为每个课程重要性和挑战度的测量标准,但是他们不能完全代表课程对学生和社会的全部价值。1.毕业学生的经济报酬问题。已往的经济学文献研究了教育产出的市场导向型评估,注意到薪水效益随学习领域和院校质量的不同而不同。一些研究试图评估学院成本与学生和院校绩效之间的关系。除了工资成果外,毕业后一定时间内找到工作的毕业生的数量;校友对他们受到教育的满意度;当地工商业界对大学提供技能职员角色的满意度;继续取得高级学位的学生的数量。这些都作为对院校绩效评价的指标。教育经济学领域在这方面做了很多工作,但即使目标是估算教育的经济报酬,但是还有许多难题没处理。如何更好地运用工资数据进行计算,哪项工资数据最重要:第一份工作,五年以上的薪水或者终身收入贴现?此外,代际、商业周期效应以及变化的劳动力市场条件都会造成相关工资的持续变动。最重要的是,影响收入的因素如学生特点、人口异质性、可达性和机会以及其他因素在这些经济研究中必须是可控的。产出测量的全面质量调整还只是预想,因为还有诸多问题有待解决。2.学生学习性投入对产出的影响。除了测量学分、学位、相关的工资收益是测量学生学习的附加价值的指标。测量学位和学分数本身不能成为高等教育产出的全部指标。如果学生取得学士学位,但是没有获得劳动力市场及社会中真正需要的知识、技术和能力,那么所得学位也不过是一个空洞的符号。测量指标应该注重的是学位质量,例如,学习的数量以及校园后的价值(如收入、职业地位以及其他测量标准),超越学位和证书本身。忽略学习质量或者学生投入性的测量,单纯强调学生的数量,可能误导院校绩效评估制定出狭隘的政策。人们是能接受一个学校学生毕业数量很多但学习性投入和成果较低,还是学生接受较高的学术挑战,显示出高水平的技能和实力,院校能够更好地满足个人和公共的利益,即使毕业生数量较少呢?学生学习性投入和成果与规模数量的绩效并不是彼此排斥的,但是每一项都代表了院校绩效和学生发展不同的方面。帕斯卡雷拉和特瑞兹尼(PascarellaandTerenzini)指出,大学对学生学习和自身发展的影响主要取决于学生个人的努力程度和在学术、人际及校内课外活动中的投入程度。学生对中等后教育体验的收获承担主要责任。一旦院校变量(例如选拔性)是可控的,学生自身的动力就成为影响大学后收入差距的重要因素[7]。为了估算教育生产率,对院校质量作出分级,大学排行榜应运而生。大多数排行榜的主要缺陷是,他们几乎不提学生在大学的体验和收获。涉及学生质量指标的排名系统局限性具体体现在只是参照一个数字进行排名,那就是录取学生的高考分数。这并不是说选拔性与学院质量无关。高选拔性的学校环境至少对某些学生的本科教育是有益的。院校的选拔性与学业成就、生源人口特征和质量差异等因素的控制紧密相关。但相反的观点认为,高校“生产率”也会受到“欠匹配”的严重损害,准备良好的学生加入富有挑战性的学校也频繁失败,尤其是那些来自贫穷家庭的孩子。换句话说,选拔性与有效教育实践不是显著相关的。院校的选拔性对学生在校期间的学习和认知发展有最低程度的贡献。如有学者对大学排行榜批评道:鉴于他们对最佳本科教育的测量主要基于资源和声望,而不是基于我们认为最重要的学生校内体验。大学排名的更精确的名字应该是“最具优势大学”[8]。相比之下,同辈因素更加重要,因其广泛地影响了学生的态度、价值观和个人及社会发展的其他维度。

二、高等教育绩效评估的展望

(一)高等教育绩效评估应当谨慎实施

尽管一些指标的测量是可以达到的,但美国统计局目前不提供教育部门生产率的测量。在美国,此类研究大多数都集中在中小学教育。此外,欧盟成员和其他国家也在研究如何测量教育的产出和投入,但在如何测量高等教育投入和真正产出的问题上还没有达成一致。高等教育生产率的现实测量要比教科书模型更具挑战性。多样的产出、异质性的投入和产出、质量随时间的变化、院校间和体系间的质量变量都增添了任务的复杂性。为了改进生产率测量,有必要认识到不是上面列举的所有的复杂性都能获得充分解释,至少现阶段是这样。单一的测量不能全面组织和总结一个部门的绩效,我们应时刻牢记其复杂性。没意识到这点,测量将必定被误用并且诱发不恰当的动机。例如,受到物质刺激鼓励的“文凭工厂”的危险确实存在。绩效测量是开发利润构成的前提,但也会造成激励某些“受欢迎”的特定行为。任何单一绩效考量,不足以实现大多数目标,尤其是那些与利益相关者需求有关的目标。高校绩效的部分测量对改善院校绩效没有多大作用。只有总体测量高等教育绩效,才能形成更佳的政策环境,进而间接地改善院校的绩效。

(二)高等教育绩效评价可借鉴方法

经合组织和高等教育院校管理机构在世界范围内联合开展高等教育领域优质教育实践研究。研究指出,全面了解教学与学习质量之间的因果关系,需要具有开创性并且深入的评估方法和工具[9]。美国国家研究委员会有关研究博士课程质量测量的报告概述了博士课程教师质量的评估方法。评估基于大量数据,较过去的评估包括更多具体题目,例如,出版数量、引用的数量、获得校外研究拨款情况、跨学科的参与度、人口统计的信息、获得奖励和荣誉的数量。该报告解决了一个复杂问题,强调教师质量测量的重要性,适合四年制研究型大学研究博士课程的绩效评估[10]。理解高等教育产出的另一个方法将是采取间接测量。经合组织制订了《成人能力国际评估计划》(PIAAC)。PIAAC将评估成人的读写和计算能力以及在技术支持的环境解决问题的能力。该项目将从参与调查的成人那里搜集大量信息,包括他们如何将技能运用到工作和其他环境,例如家里和社区。最理想的情况是,基于PIAAC收集的信息,除了教育收获,学院专业,已往工作经历、加入高等教育院校的时间和类型有关的信息,可被用来估算高等教育产出。因此,PIAAC和其他基于技能的调查可能会为高等教育产出或生产率评价提供有益借鉴[11]。

作者:苑健工作单位:北京航空航天大学