测验考试总结范文

导语：如何才能写好一篇测验考试总结，这就需要搜集整理更多的资料和文献，欢迎阅读由公务员之家整理的十篇范文，供你借鉴。

测验考试总结

篇1

国家公务员考试《行政职业能力测验》是对未来从事行政工作的国家机关工作人员是否具备行政工作能力的一种可能性的测查与验证。与单纯以基础知识和智力为主要考查对象的一般测验不同，行政职业能力测验考查的是人的基本资质与潜在能力，具体表现在考查考生是否具备快速、敏捷、准确地分析、解决问题的能力。

在国家公务员招录考试发展的十余年里，《行政职业能力测验》考试命题规律可概括为以下三点。

1、多样性、广泛性

国家公务员考试《行政职业能力测验》包括言语理解与表达、数量关系、判断推理、资料分析、常识判断五种类型的题目。通俗地讲，这种测验在形式上涵盖了对汉语基础、逻辑、文史、社科、数学、时政、法律等各方面的综合测试。这种广范围的题型及考点设计，正体现了公务员考试公正、公平的精神——不偏向于任何一门专业，保证“人人可参与，人人可发挥”，也保证日后从事公职的人员不是“偏才怪才”，而是各种能力均具备、各种岗位均可适应的全才。

2、基础性、思维性

历年国家公务员考试大纲的“测试内容”部分规定：行政职业能力测验主要测查与公务员职业密切相关的、适合通过客观化纸笔测验方式进行考查的基本素质和能力。从历年国家公务员考试与地方真题也可以看出，《行政职业能力测验》90%以上的题目均为基础性题目。这种基础性既是针对某一专门学科而言，也是针对从事公务员工作所应知应会的基本素养而言。然而，基础并非意味着简单，这种基础性是与思维性紧密结合的，考核的是“活生生”的知识，需要考生有“活”的思维来与之对应。

篇2

第一个方面是题型。

从备考的角度来看题型，那题型的量是更大的。考试前考生所要准备的，就是想方设法的扩大自己的题型库，最简单的方法就是做真题。现在从中央到地方，公布的真题大概有90套，考生能做40多套真题就已经足够了，每一套真题和真题之间的题型差距也是比较大的，做了40多套对应付这次考试问题肯定是不大的。

第二个方面是题型后面的快速解法。

行政职业能力测验的考试是一个时间的赛跑。每个题型所采用的方法的解答速度是不一样的，所以考生在掌握题型的同时还要想方设法的找到这个题型最快捷的解答方法。

第三个方面是心态的调整。

第一阶段是用十天左右的时间做题，这个时候做题，强调一个原则就是慢慢的做，不要太快，这时候做题很明确，目的在于分析和总结题型。这是一个新题型，它的特点是什么，又出现一个新题型，它的特点又是什么，一定要这样的总结，十天的时间通过做真题的形式把你的题型库扩大。

篇3

很多人认为，国家公务员考试，特别是《行政职业能力测验》和《申论》两门科目不需要做复习和准备工作，完全靠的是自身的能力和素质，其实提前准备一下还是大有益处的。相当一部分考生在走出公务员考试的考场后，都发出同样的感慨：只要认真准备，国家公务员考试其实并不难。

公务员考试命题研究专家张奉均认为，考生应着重从以下几个方面进行复习：

第一，考生要与时俱进，按照年度考试大纲的要求进行准备。他说，每年的考试大纲都对考生有不同的要求，这需要考生仔细地阅读。如，从2005年的考试大纲看，《行政职业能力测验》比以往主要有以下变化：一是原A、B类的职位划分改为甲、乙类职位划分，这也预示着2005年公共科目考试会有一定的变化；二是考题顺序的调整，将言语理解与表达调整到第一部分，这给考生的答题时间的安排设置了一个考验；三是恢复对数字推理题型的考查，这体现了对考生数理能力考查的重要性；四是恢复对事件排序题型的考查；五是常识判断部分侧重考察法律知识的运用，因此对基本法律常识的了解应成为考生备考的重点；六是取消了听力理解。

第二，考前练习很重要。对大多数考生来说，公务员考试都是第一次，都还不是很熟悉，只有多做练习才能对考试的题型、考查点有一个全面的了解，在考试时才能作到心中有数。

第三，注重平时积累和方法总结。《行政职业能力测验》的考题覆盖面颇广，包括法律、政治、经济、人文、社会、科技和管理等方面的内容，临时突击做练习虽有帮助但更重要的是平时的积累。在数字推理和判断推理部分主要考查考生的解题技巧，而不是考查考生的知识深度。

不管是报考哪一类职位的考生，关键是要熟悉《行政职业能力测验》和《申论》的考试方法。

他提醒考生，不同的题型要用不同的方法和思路去解答，比如《行政职业能力测验》中的判断、推理等题目，主要靠平时的积累，不管是知识的积累，还是实践的积累，都很重要。例如，推理题经常给出一系列日常行为事件，要求考生按行为发生的先后顺序排序，这就需要考生有实践的积累。

而数量关系和资料分析类的题目更需要技巧，这些技巧是和一个人的思维方式、价值观相连的，所以，要通过考试，更需要方法和积累。“高分低能的考生肯定是无法通过这样的考试的”，张奉均强调。

篇4

一、论证推理

论证推理题是指在论证分析的过程中需要补充某些部分，以加强或者削弱给定的结论。对于此种题型，根据论证角度的不同，其题型可以分为前提假设型、支持加强型、削弱质疑型和原因解释型。

其中需要重点掌握的是削弱质疑型和支持加强型。对于这两类题，首先要找到它的论点，明确需要削弱或者支持的论点是什么，然后找到论证过程，结合选项进行作答。

例1、市长任职的三年里经常被控对女性有性别歧视的态度。然而，他已经在他的管理层的19个高层职位中任用了5名妇女，她们中的所有人都仍在服务，这表明市长并不是一名性别歧视者。

以下哪项为真，最能反驳上面得出的结论？[2014年山西公务员考试行政职业能力测验真题-83]

A.市长任命的一名高层职位的女性正准备辞职

B.市长所在的政党的政纲要求他在高层职位里至少任命5名女性

C.三年前在市长选举中，47％的女性投票支持这位市长

D.相邻市的市长最近在高层职位任命了7名女性

解析：本题属于削弱质疑型，削弱方式为他因削弱。要削弱的论点是“市长不是一名性别歧视者”，如果B项为真，则表明市长任用了5名妇女可能是其他原因，即任用5名妇女不能作为市长不歧视女性的证据，因而反驳了题干的结论。其他三项均不能反驳“市长不是一名性别歧视者”。所以选择B选项。

例2、某镇组织部姚科长在接受当地记者的采访时说：“近年来刚进入机关的干部对下基层锻炼的兴趣普遍比以前强多了。我镇的机关干部对于下基层的报名十分踊跃。这在几年前几乎是不可思议的。”

姚科长的结论基于以下哪项假设？[2014年山西公务员考试行政职业能力测验真题-85]

A.机关干部下基层锻炼，对当地的发展也起到推动的作用

B.对待下基层的态度是衡量是否有下基层兴趣的重要标准

C.近年来进入该镇的干部较前几年的比起来有较高的综合素质

D.该镇机关干部对下基层锻炼产生兴趣，是由于基层待遇提高

解析：本题属于前提假设型。B选项是必须假设的，否则下基层的态度和兴趣没有关系，那就不能通过报名踊跃得出兴趣强的结论。所以B选项是必须假设的，所以选择B选项。

提示：在这种题型中，要迅速找到题干的论据和结论，然后在选项中找到能把论据和结论联系起来的选项，就是正确选项。

二、日常推理

日常推理题是在题干中列举大量事实论据或理论论据，然后考查考生从中可以得出或无法得出某个结论。对于此类题型，首先要抓住题干的主体，因为偷换概念是我们日常生活中常犯的错误，也是题目设置的主要考点，在解题时要注意收敛思维，选择与主体一致的答案。

例3、近期的食物监测表明：炸薯片中含有大量的铝，长期食用会引起神经系统病变，表现为记忆力减退，视觉与运动系统协调失灵。

由此可以推出：[2014年山西公务员考试行政职业能力测验真题-76]

A.少吃薯片可以防止神经系统病变

B.铝在人体中的积累可导致神经系统病变

C.记忆力减退说明神经系统发生病变

D.视觉与运动系统协调失灵说明神经系统发生病变

解析：本题属于隐性结论型。题干指出长期食用炸薯片会引起神经系统病变，前者是后者的充分条件。充分条件的假言推理否定前件（不食用薯片）不能否定后件（不病变），所以A项不能推出；炸薯片中含有大量的铝，如果长期食用炸薯片，那么铝就会在人体中积累起来，就会引起神经系统病变，所以B项可以推出；神经系统病变的表现有记忆力减退，视觉与运动系统协调失灵，前者是后者的充分条件，充分条件的假言推理肯定后件（记忆力减退，视觉与运动系统协调失灵）不能肯定前件（神经系统病变），故C项和D项均不能推出。所以选择B选项。

提示：在这种题型中，要抓住题干的主体，如此题中的“铝”，题干的主体和正确选项的主体通常是一致的，选项中常见的错误有偷换主体、夸大事实、以偏概全等，可以通过观察选项的特征来排除错误选项，选择正确答案。

三、形式逻辑

形式逻辑是运用逻辑规则进行的必然性推理，因此要求考生掌握必要的逻辑学基础知识。山西省公务员考试行政职业能力测验中常考的形式逻辑类题型为分析推理，此类题通常给出若干人或事物，要求利用互相间的关系，对其进行组合，实现一一对应。

有的考生对于此种题型的大量信息往往感到无从下手，为此总结了解决此类题型的有效方法。

第一步：对描述共同信息最多的条件进行分析，得到推理起点（最大信息优先）；

第二步：寻找与已知结论相关的条件，继续推理；

第三步：难以得到肯定结论时，运用假设法，找到逻辑矛盾，进而得到肯定结论。

第四步：重复第二步。

下面结合真题来说明此种方法的运用。

例4、在一次考试中，试卷上画了五大洲的图形，每个图形都编了号，要求填出其中任意两个洲名，分别有五名学生填了如下编号。

甲：3是欧洲，2是美洲

乙：4是亚洲，2是大洋洲

丙：1是亚洲，5是非洲

丁：4是非洲，3是大洋洲

戊：2是欧洲，5是美洲

结果他们每人只填对一半，请根据以上条件判断下列正确的选项是（）[2014年山西公务员考试行政职业能力测验真题-76]

A.1是亚洲，2是欧洲

B.2是大洋洲，3是非洲

C.3是欧洲，4是非洲

D.4是美洲，5是非洲

篇5

1 研究情况

1.1研究对象重庆医科大学已进入临床专业课程学习阶段的临床医学本科学生。以自然班为对象随机设立实验组与对照组，实验组179人，对照组169人。

1.2研究方法在两组学生的儿科学教学中实施不同的评价方式，在授课教师、教学内容、教学方法、学时数、使用教材等方面完全一致。实验组采用“形成性评价为导向的综合评价”方法，对照组采用以期末考试为主的总结性评价方法。将两组学生的学习效果进行比较，并对两种评价方式的相关性、差异性进行统计分析。在课159程结束后，采用自制问卷对实验组学生的学习状态进行调查并运用SPSS 20. 0软件进行统计分析。

1.3评价方案本研究在充分征求授课教研室教师意见的基础上制定评价方案（见表1)。实验组的评价内容由课堂纪律、床旁示教讨论、学习记录档案袋（网络辅助）、期中测验、期末考试5部分组成。其中，课堂纪律、床旁示教讨论环节由评价者借助日常教学日志的客观记录完成评价；学习记录档案袋（网络辅助）、期中测验、期末考试环节设置了一致的评价标准，评价者依据标准即可给予学生评价。学习记录档案袋的评价在重庆医科大学网络教学平台的辅助下进行，学习记录档案袋中以案例分析、网络学习、师生互动讨论为基础，包含课后作业、学习与教学互动情况，为评价结果提供客观可信的依据。对照组采用传统的期末考试总结性评价方式，结果由考试成绩数值构成。为了比较两组学生的客观学习效果，对照组也参与了期中理论测验，但测验结果不计入综合性评价。为避免因评价者主观因素导致评价客观性、公平性降低，评价内容尽可能采取能够量化的方式，并辅以过程记录为客观依据。同时，为了保证大样本评价的可操作性，儿科专业研究生担任课程教学助教，由儿科学课程组组织和培训参与教学工作。评价者由课程教师和助教共同构成，共计32名。评价者承诺严格按照指标客观、公正给予评价。同时，在课程教学过程中，专业助教负责记录教学日志及学生课堂纪律、课堂表现，日志内容作为教学组教师评价的客观依据之一，补充和完善教师评价。

2学习效果分析

课程考试是检验学习效果、评价教学质量、衡量教学目标是否实现的重要手段。因此，以两组学生的儿科学期中、期末课程考试成绩比较作为两组学生学习效果差异的评价指标。两组儿科学课程期中、期末考试采取同一时间、同一试卷考试，内容、题量、难度一致。两次的试卷命题均包括单选题、填空题、判断题、问答题、病例分析题五大题型，主要从基本知识点、初步临床思维、综合分析问题等方面对学生的学习效果进行考核。根据表2数据显示，实验组学生期中测验、期末考试以及总评成绩的数据分布离散程度小，较对照组更为集中和稳定。两组学生期中测验的客观成绩差异无统计学意义（P = 0. 898>0. 05);两组学生的期末考试成绩、总评成绩均存在显著差异，且差异均有统计学意义(P<0. 01)。同时，实验组学生对基本理论知识的掌握较期中测验时显得更为牢固（期中65. 0±9. 6，期末7 6. 8±8. 8 )，整体水平有提升；对照组的提升效果明显低于实验组（期中64. 7 士 10. 5，期末72. 8 士11.2)。

在考试成绩分布上（见表3)70 — 90分段中，实验组149人（占实验组总数的83. 24%)，对照组110人 (占对照组总数的65. 09%)不及格人数中，实验组2 人（占实验组总数的1. 12%)，对照组为22人（对照组总数的13. 01%)。根据学习记录档案袋以及课程教学日志显示，实验组不及格的两名学生除了期末理论考试成绩外，其余项目的评价结果均为“差”，评价的客观结果均在60分以下。

对两组学生共同使用的期中、期末理论试卷进行信度分析，克朗巴赫系数（Cronbach' Alpha)分别为 0.6654和0.8476，试卷信度可靠。从表2的数据结果来看，实验组学生体现出的知识水平和综合能力水平优于对照组，总体学习效果优于对照组。

2.2 实验组综合评价方式与学习效果的相关性分析教学评价的方式多种多样。

为了检验评价方式的合理性和有效性，学生整体学习质量、学习效果的优良成为了重要的衡量指标。因此，本研究将实验组综合评价结果同学生学习效果进行相关性分析，检验“形成性评价为导向的综合评价模式”在儿科学课程教学中是否合理、有效。分析数据见表4。根据统计学对相关系数的界定，1为正相关，一1 为负相关，0为不相关，当相关系数大于0. 8时，可以认为两个变量之间有很强的相关性。从表4的数据分析来看，实验组综合性评价的总评成绩均与期中、期末成绩呈显著正相关，与期末成绩的相关程度明显高于期中成绩。可见，以形成性评价为主的综合评价方式长期、稳定实施，有助于学生学习效果的提高。

3实验组学习状态与感受调查

儿科学课程教学结束后，就实验组学习状态与感受进行调查，主要包括“学习压力、学习负担的学习状态与提高学习兴趣、临床思维能力、逻辑思维能力、沟通交流能力、团队协作能力的个人感受”个方面。发放调查问卷179份，回收问卷174份，有效问卷174 份，有效回收率为97.21%。回收的问卷用Excel建立数据库，并运用SPSS 20. 0软件进行信度系数检验，得出问卷信度为0.816，大于0. 8，可以推断此问卷的内部一致性较高，可信度较好。详细数据见表5。

根据数据显示，实验组大部分学生学习兴趣很高，通过儿科学课程的学习，建立了初步的临床思维，提高了自身的逻辑思维、沟通交流、团队协作、主动学习等四方面能力，在学习过程中并未感受到太大的学习压力和学习负担。

4结论及思考

4.1长期、稳定的以形成性评价为导向的综合评价模式能有效提高学习的学习积极性与主动性实验组的评价方案涵盖了整个儿科学的教学过程。根据表4、的数据分析结果可以看出，在课程教学结束时，综合性评价对实验组学生学习效果的影响明显高于期中时的影响。并且，与对照组相比，实验组的学习效果更好，两者有明显的效果差异。从表2、3、 5的数据对比分析结果来看，实验组学生在以形成性评价为导向的综合评价模式引导下，以往学习中存在的功利主义思想得到扭转。大部分学生在学习过程中更多地着眼于对基本知识的吸收、掌握，对自身思维方式、综合能力的训练和提高。调查结果显示，在综合评价模式的引导下，实验组学生能够更积极、愉快地投入到儿科学学习中，表现出很强的学习兴趣。

4.2 以网络平台为基础的学习记录档案袋，有助于师生互动反馈，显著提升教学效果网络平台的运用，弥补了课堂教学时间有限、空间不足的问题，为学生进一步巩固及深入了解儿科学知识、训练儿科临床思维，为师生间的有效沟通提供了更广阔的平台。网络平台能将学生每次的访问内容、案例分析、学习互动以及教师评价的情况如实记录，形成观、动态的学习记录档案袋。教与学双方都能从网络平台中导出学生个人学习状态及对应的评价信息，并能够借助这些信息，在教学过程中不断总结与反思，指导或修正后续阶段的教学行为，使教学效果得到提升。

4.3 完善综合性评价方案，提高评价效力在实验组的综合性评价方案中，总结性评价以期末考试的方式展开，而形成性评价则包括了多项内容：学习纪律、学习态度、学习效果、综合能力，等等。多种因素的评价结果是否客观、公正，直接影响最终的评价效力。虽然本次研究尽可能扩大了评价者的数量，评价者达到32名，即一个评价者关注5 — 6名学生即可。但根据评价者反馈，在对学生学习表现进行评价时，床旁示教讨论等以鼓励、引导为主要方式的环节，评价的操作性和公平性仍难达到最佳状态。究其原因是在具体操作中，评价者往往会被个别表现突出的学生所吸引，而忽略了对其余学生的关注和引导。因此在这些环节中，评价者会由于主观原因而使得评价结果的公平性和客观性降低，这也直接导致在进行综合评价时，评价的效力减弱。所以，评价方案应进一步细化，提高可操作性，尽可能降低人为因素对评价结果的影响，提高评价结果的说服力。

篇6

高等学校博士学科点专项科研基金联合资助课题(20103604110002)，国家自然科学基金（31100756），江西省高校人文社会科学研究青年基金（XL1003）。

通讯作者：戴海琦，E-mail：。

摘要：群体不变性是等值的一个重要假设，即对不同的考生子群体等值函数一致。本研究对不同平行测验定义下线性等值的群体不变性进行了理论分析和模拟研究，模拟研究REMSD指标通过六种不同加权方式计算。结果显示，严格平行测验在信度较低时REMSD指标更大；子群体均值差异和信度差异对REMSD的影响存在明显的交互作用；REMSD指标在期望权重等权下的最大，在分数权重采用子群体比例加权最小。最后对结果进行了讨论，对REMSD权重使用及进一步研究给出了建议。

关键词：等值；群体不变性；平行测验；同质测验

中图分类号：B841.2

文献标识码：A 文章编号：1003-5184(2012)01-0067-05

1 引言

等值（Equating）是实现平行测验分数相互比较的重要技术。有些情况下，研究者也需要建立并非严格平行测验的分数对应关系，如一些大型考试的内容进行了更新，此时新旧考试并非平行测验，但不论从实践还是从研究角度都有必要报告新旧考试的分数对应关系，此时称之为链接（Linking）（Kolen，2004）。链接是实现不同测验分数比较的一般形式，当链接的两个测验满足了相同构念、等信度、对称性、公平性、群体不变性等五个条件，即为等值（Dorans & Holland，2000）。即，等值是要求更为严格的链接。

近年来，研究者对锚测验代表性、不同等值方法的稳健性进行了大量研究，花费了大量时间和精力收集测验数据以进行等值，但很少有实践者关注等值过程是否真正实现了测验分数可比。Flanagan指出测验的本质是抽样，不同测验在内容上的差异（包括平行测验）使等值或链接对不同群体的敏感性存在差异（Kolen，2004）。所以必须考虑等值函数是否对所有被试唯一确定，若测验间的分数对应关系不因被试所在群体而变化，则称等值的群体不变性（Population Invariance，PI）成立。群体不变性是等值最重要的假设之一，在评估考试分数的公平性时起着重要的作用，在其不成立时使用统一的等值函数对被试而言是不公平的。

第32卷第1期

刘铁川等不同定义平行测验等值的群体不变性

心理学探新2012年

近年来，在Dorans和Holland（2000）提出了群体不变性的量化评价指标之后，关于等值或链接群体不变性问题的研究才开始大量出现，对一些大型规模考试项目如美国大学预修课程考试（AP；Dorans，2004；Yang，2004；Von Davier & Wilson，2008）、学术性向测验（SAT；Yi，Harris，& Gao，2008）、法学院入学考试（LSAT；Liu & Holland，2008）、大学代数考试（CLEP；Yang & Gao,2008）的等值或链接的群体不变性进行了研究。他们所提出的指标称为均方根差异（Root Mean Square Difference，RMSD），比较在不同子群体和整个被试群体上计算出的等值函数的差异，公式如下：

RMSD(x)=∑jwj［ePj(x)－eP(x)］2σYP（1）

公式1适用于单组或等组设计下的观察分数等值，也就是说被试群体P中的所有被试来自同一总体；其中，x表示测验形式X的某个分数；eP(x)表示由全部被试数据估计出由X到Y的等值转换关系；ePj(x)表示由子群体j的数据所估计出的等值转换关系；分母σYP是全部被试数据估计出的Y测验的标准差；wj表示对子群体Pj与全部被试P等值关系差异的权重。wj有两种计算方法，其一是以子群体被试比例作为权重，公式为Nj/N，其中Nj为第j组被试数量，N为所有被试数量，此时应保证样本数据中的被试比例结构能够代表测验的真实使用情境；其二是进行等量加权。

RMSD(x)是对个别测验分数水平上评价等值的群体不变性，可以对等值差异求期望、再加权、开平方以得到总结性的指标，用来对整个测验等值关系的群体不变性进行整体评价，称为期望均方根差异（Root Expected Mean Square Difference，REMSD）。具体公式如下：

REMSD=∑jwj∑max (x)x=min (x)vxj［ePj(x)－eP(x)］2σYP（2）

上式中，wj可称为期望权重，获取方法同前；vxj为题目分数权重。vxj有三种计算方法，其一为子群体比例加权，公式为Nxj/Nj，其中Nxj为第j组中测验分数水平x被试数量；其二为总体比例加权，公式为Nx/N，其中Nx为全部被试中测验分数水平x被试数量；其三为等量加权，公式为1/max (x)－min (x)+1，Kolen和Brennan（2004）称之为等权REMSD（ewREMSD）。分数权重的选择取决于研究者的经验，若研究对各个分数水平的等值准确性同样重要，则宜用等权；若样本数据能够代表实际应用情境，则根据样本数据的分数比例进行加权，Dorans和Holland（2000）倾向于使用总体比例加权，而Kolen和Brennan（2004）倾向于使用子群体比例加权。

锚测验不等组设计（Non-Equivalent Anchor Test，NEAT）是很常见的等值数据搜集方法，但公式1、公式2只适用于单组或等设计下的观察分数等值。为探索更复杂设计下的等值群体不变性，Von Davier，Holland和Thayer（2004）将RMSD(x)和REMSD推广至NEAT设计下的等值群体不变性评价，但关注的仍是观察分数等值。Von Davier和Wilson（2008）又将此指标应用于NEAT设计下项目反应理论下的真分数等值的群体不变性研究。

NEAT设计中，参加两个测验X、Y的被试分别来自总体P和Q，根据人口统计变量将P和Q分成多个子群体，对其中第j子群体加权合成后可以得到合成组子群体Tj（公式3）。对于RMSD(x)和REMSD公式中合成组子群体的权重，一种方法是设子群体权重相等；另一种方法是，根据P和Q子群体j的权重来加权计算，公式如下：

Tj=w(Pj)+(1－w)Qj，wj=w(wPj)+(1－w)wQj（3）

上式中，wPj和wQj为子群体j在P和Q中的权重；w为P的权重，可以根据P的比例来计算。NEAT设计下计算群体不变性指标还需要合成组在Y测验上的标准差，由于只有Q群体的被试参加了测验Y，所以无法直接得到合成组标准差，需要使用Tucker方法、或链线性等值方法计算（Von Davier et al.，2004）。

虽然群体不变性假设对等值质量至关重要，但关于REMSD指标加权方式及其影响因素的研究不多。本文将对不同平行测验定义下线性等值函数差异进行理论分析，并在模拟条件下计算不同加权方式的REMSD指标，对影响线性等值群体不变性的因素以及加权方式对REMSD指标的影响进行探索。

2 不同定义平行测验等值的群体不变性

测量学中对平行测验有多种定义，如严格平行（Strictly Parallel）、Tau等价（Tau Equivalent）、基本Tau等价（Essentially Tau Equivalent）、同质（Congeneric）等。Brennan（2008）对平行线性等值下的REMSD公式进行了研究，他认为若两测验严格平行或满足Tau等价的条件，并且各组被试在两测验上的分数分布都相同，此时无论信度水平如何，REMSD均为0，等值的群体不变性都成立，事实上此时没有必要进行等值；若两测验满足基本Tau等价，被试的测验真分数相差一个常数，误差方差不一致导致两测验信度不同，但一般情况下比较接近，此时群体不变性基本成立；若两测验同质，被试在两测验上的真分数存在线性关系，真分数方差与误差方差都不一致，两测验所测构念相同，但信度水平相差越大，REMSD也越大，群体不变性通常不成立。

下面通过真分数等值函数对同质测验的群体不变性进行分析。在同质条件下，测验X与测验Y所测构念相同，被试在两测验上的真分数存在如下线性关系(Holland & Dorans,2006)：

TY=α・TX+β （4）

α=σY/σX・ρYT/ρXT，β=μY－α・μX（5）

公式（4）中，TX和TY为两测验上的真分数；公式（5）中，σX和σY为两测验观察分数标准差，ρXT和ρYT为信度系数的平方根，μX和μY为两测验观察分数平均值。上式与观察分数的线性等值函数相似，但斜率系数增加了信度比值的平方根作为乘数。用a和b来表示测验X和测验Y观察分数等值函数的斜率和截矩，可以得到下式：

a=α・ρXT/ρYT=

(α2・σ2XT+E2Y)/(σ2XT+E2X)，b=μY－a・μX（6）

公式（6）中，σ2XT和σ2YT为两测验真分数方差，E2XT和E2YT为两测验的误差方差。REMSD指标会受到子群体间等值系数差异的影响，若两测验满足同质条件，不论被试属于哪个子群体，公式（4）对所有被试成立（Brennan，2008）。此时，公式（6）中的斜率系数a对子群体相同，对于截矩系数，由公式（4）和（6）可得b=β+α・1－ρXT/ρYT・μX，可以看出满足同质条件的测验，若子群体分布均值不同，则观察分数等值的截矩系数b也不同。

通过上式可以对其他三种平行测验定义下的子群体等值系数差异进行分析。满足严格平行条件的测验，两测验信度相同，所以观察分数等值的斜率系数a为1，截矩系数b为0，各子群体相同。满足Tau等价的测验，两测验信度不同，斜率系数a不为1，但各子群体相同；截矩系数b=1－ρXT/ρYT・μX，由于两测验信度不同，所以系数b不为0。满足基本Tau等价的测验，两测验的真分数方差与误差方差均不相同，两测验信度不同，斜率系数a不为1，但各子群体相同；截矩系数b=β+1－ρXT/ρYT・μX。可以看出，对于Tau等价和基本Tau等价测验，子群体观察分数等值截矩系数的差异大小取决于他们在测验X上的分数均值。

两测验信度水平差异也影响截矩系数的差异，Dorans和Holland（2000）认为实践中两个测验信度不会完全相同，如链等百分位等值方法中，锚测验中由于题目数量少，其信度要低于全长测验，仍然可以获得理想的等值结果。所以，他们认为信度是等值过程中需要考虑的次要因素。Liu和Holland（2008）对LSAT考试的研究发现，若两平行测验的信度相似，则等值过程通常具备群体不变性，他们认为只要测验的稳定性达到一定水准，信度对平行测验等值的群体不变性影响不大。Dorans和Holland（2000）给出了单组设计下平行线性等值下的群体不变性指标的上限公式，在这个公式中两测验的信度越高，则REMSD的上限值越小。需要注意的是，信度高只是使可能的上限更小，并不一定使REMSD的实际取值更小。

3 不同平行测验定义下的模拟实验

如前所述，在REMSD指标的计算中有两次加权，期望权重wj可采用等权（ew）和比例加权（pw），分数权重vxj可采用等权（ev）、总体比例加权（pv）和子群体比例加权（gv）。所以REMSD可有六种组合加权方式，分别表示为ew.ev、ew.pv、ew.gv、pw.ev、pw.pv、pw.gv。本研究自编程序模拟不同平行测验定义下的数据，通过计算上述六种不同加权方式的REMSD指标来评价各种条件下线性等值的群体不变性。

3.1 严格平行测验

对严格平行测验，两测验的信度包括08、06、04、02四种条件，其中一个子群体均值为70，真分数标准差为7，又更接近真实情境，另一个子群体的均值与之相同或相差一个标准差。在不同群体被试所占比例相同的条件下，REMSD指标中的期望权重采用等权和采用比例加权结果是一致的，而实际研究中不同群体的样本量通常不一致，所以两子群体样本量分别设为1000、2000。每种条件重复100次。

表1呈现了不同条件下严格平行测验的六种群体不变性指标的模拟结果。可以看出，在各种条件下，期望权重和分数权重采用等权时的REMSD指标取值要比其他加权组合方式更大。当子群体分布相同时，REMSD指标的分数权重采用总体比例加权和子群体比例加权的结果一致，当子群体分布不同时，采用总体比例加权的REMSD指标值总是大于使用子群体比例加权。随两测验信度水平下降，六种权重组合的REMSD指标均增加。

3.2 同质测验

对同质测验，两测验信度水平分别为(0.8，08)、(0.8，0.9)、(0.9，0.8)三种条件，真分数等值斜率有0.9、1.1两个水平，代表较易和较难的两个测验，真分数截矩设为1.75，其它设定与严格平行测验相同。

由表2可以看出，在子群体分布均值相同条件下，由高信度测验等值到低信度测验的REMSD较小，两测验信度差异并不会使REMSD增加，而是略有下降；在子群体分布均值不同条件下，两测验信度差异会使REMSD增加较大，斜率为0.9时，由低信度测验等值到高信度测验的REMSD比由高信度到低信度等值的更小，斜率为1.1时趋势相反，但不明显。

Tau等价与基本Tau等价是同质条件的特例，结果与同质条件相似，限于篇幅不再呈现结果。对于这三种非严格平行测验，与严格平行测验条件下相同，两个权重都采用等权下的REMSD最大，而期望权重采用比例加权、分数权重采用子群体比例加权时的REMSD最小。

4 讨论和总结

本研究通过理论分析和模拟数据对不同平行测验定义下的线性等值的群体不变性进行了探索，结果与前人研究有所不同。

对于严格平行测验，本文第二部分的理论分析可以得出子群体等值系数无差异的结论。Brennan（2008）认为等信度条件下信度水平高低并不是等值群体不变性的必要条件，信度越小，REMSD取值越小。但模拟数据结果与此不同，随着测验信度水平下降，各种加权方式下的REMSD都会增加。需要指出的是，随着测验信度下降，误差成分在观察分数中所占比例变大，此时估计出的等值关系很少能反映真分数之间的对应关系，而更多是由随机误差所决定，而REMSD指标并没有反映等值系数的估计误差，这可能是理论分析与模拟结果不一致的原因。

对满足同质条件的测验，子群体等值系数差异主要在截矩系数，差异的大小可能会受到两测验信度差异和分数分布的影响。模拟数据进一步显示两个因素存在明显的交互作用，子群体均值相同时，信度差异增加不会使REMSD增加，而子群体均值存在差异时，信度差异会使REMSD增加较大。由低信度测验等值到高信度测验与相反情形下的REMSD之间存在差异，但很小。

对于REMSD的加权方式，期望权重和分数权重采用等权时比其它加权方式要更大，当子群体分布不同时，分数权重采用总体比例加权的REMSD指标值总是大于使用子群体比例加权。以往研究认为指标权重的选取是主观的，实际数据中分数分布通常存在差异，本研究以为REMSD指标中的分数权重采用子群体比例加权更为恰当。

本文对等值的群体不变性的分析基于各种定义下的平行测验，对等值群体不变性的分析有一个重要的假定，即各子群体的真分数对应关系相同。但这个假设在实践中可能不满足，如测验X对子群体是公平的，测验均值相同，但测验Y由于内容不当题目数量较多则存在功能差异，一个子群体的考生更擅长这些考试内容。那么在测验X上得分相同的不同子群体的考生在测验Y上得分会存在差异，所以两测验在内容上的差异可能导致子群体真分数对应关系不同，此时子群体等值函数的截矩与斜率均不相同，REMSD指标可能较大。可能由于这个原因，所以链接通常不满足群体不变性（Kolen，2004）。

具备群体不变性的等值才是公平有效的，而实测数据中人口统计信息的缺乏限制了对等值假设的检验。无法使用不同的等值函数转换分数时，如何解决群体不变性不成立时的等值对于实践者来说也是一个难题。理论上，项目功能差异题目可对等值群体不变性产生影响，但影响方式、影响大小尚未有研究涉及。这些都是关于群体不变性的进一步研究所亟待解决的问题。

参考文献

Brennan，R.L.(2008).A discussion of population invariance.Applied Psychological Measurement，32(1)，102-114.

Dorans，N.J.(2004).Using subpopulation invariance to assess test score equity.Journal of Educational Measurement，41(1)，43-68.

Dorans，N.J.，& Holland，P.W.(2000).Population invariance and the equatability of tests：Basic theory and the linear case.Journal of Educational Measurement，37(4)，281-306.

Dorans，N.J.，Liu，J.，& Hammond，S.(2008).Anchor test type and population invariance：An exploration across subpopulations and test administrations.Applied Psychological Measurement，32，81-97.

Holland，P.W.，& Dorans，N.J.(2006).Linking and equating.In R.L.Brennan(Ed.)，Educational measurement(4th ed.）.（pp.187-220).American Council on Education /Praeger，Westport，CT.

Kolen，M.J.(2004).Population invariance in equating and linking：Concept and history.Journal of Educational Measurement，41(1)，3-14.

Kolen，M.J.，& Brennan，R.J.(2004).Test equating：Methods and practices.New York：Springer.

Liu，M.，& Holland，P.W.(2008).Exploring population sensitivity of linking functions across three law school admission test administrations.Applied Psychological Measurement，32，27-44.

Von Davier，A.A.，& Wilson，C.(2008).Investigating the population sensitivity assumption of item response theory true-score equating across two subgroups of examinees and two test formats.Applied Psychological Measurement，32(1)，11-26.

Von Davier，A.A.，Holland，P.W.，& Thayer，D.T.(2004).The chain and post-stratification methods for observed-score equating and their relationship to population invariance.Journal of Educational Measurement，41，15-32.

Yang，W.-L.(2004).Sensitivity of linkings between AP multiple-choice scores and composite scores to geographical region：An illustration of checking for population invariance.Journal of Educational Measurement，41(1)，33-41.

Yang，W.-L.，& Gao，R.(2008).Invariance of score linkings across gender groups for forms of a testlet-based college-level examination program examination.Applied Psychological Measurement，32，45-61.

Yi，Q.，Harris，D.J.，& Gao，X.(2008).Invariance of equating functions across different subgroups of examinees taking a science achievement test.Applied Psychological Measurement，32，62-80.

Population Invariance of Linear Equating under

Different Definition of Parallel Test

Liu Tiechuan1，Dai Haiqi1，Zhao Yu2

(1.School of Psychology，Jiangxi Normal University，Nanchang 330022；

(2.Department of Psychology，Gannan Medical College，Ganzhou 341000)

Abstract：

篇7

一、教学课程计划的改革

1.教学课程计划要突出主要学科，保证学科之间的联系

学校制定教学课程计划时，要在分析各学科的性质、任务、特点及相互关系的基础上，确定所要开设的学科、学科顺序、开设时间、教学时数，规定教学的内容、范围和时间等，学科设置要有主有次。语文是中学的主要学科，要从时间安排上高度重视起来。各学科之间要互相联系、互相配合，不能互相隔绝、各自为政。教师在语文教学中可以适当地为学生介绍与教学内容相关的地理、政治、美术知识，学科之间的融合能促进学生开阔思路，提高学习的积极性，对语文教学有促进作用。

2.打好学习基础，关注学生的发展

学生是学习的主体，按照课程计划所执行的教学方式要符合学生的身心发展水平和接受能力，注重教学内容的趣味性和学生掌握知识的可能性，强调基础知识的传授和基本技能的养成。尤其是基础知识，这是学生深入学习的根本，如果基础的东西都掌握不了，更不用谈学生学习能力的培养、道德的升华。在知识经济的时代，要让学生在牢固的知识基础之上进行能力和整体素质的提高。

3.课程计划要有统一性、稳定性和灵活性

语文教学要按照全国统一的教学大纲、新课标来指导教学，这样才能保证教学的正确方向。素质教育改革的深入实施，使素质教育这个核心目标成为教学课程计划的导向。具体到教学时间中，教师的计划要根据教材内容，根据学生的情况进行编排，一旦形成，不能朝令夕改。教师在教学中的时间安排要严格执行，不能因为一些阻碍就把课程时间拖延，影响整体的计划。当然，教师在具体的计划细节上还要做到灵活多变，因为课堂教学面对的是学生，有很多不确定的因素，教师要根据学生的学习情况进行调整。

4.教师要开阔视野，学习先进的教学经验

教师对课程计划的制定要立足国内，放眼世界，纵向上总结国内以往课程计划的成败得失，横向上比较国外相关的课程计划，从中吸取可以借鉴的经验。

二、考试评价内容的改革

传统的考试以纸笔测验为主要形式，突出了三个中心，即“教师中心”“教材中心”“课堂中心”，考试内容严重脱离实际，导致学生通过了考试，虽然成绩优秀，但对知识地灵活运用等方面的能力不足。素质教育强调的是学生的全面发展，即知识和技能、过程与方法、情感态度和价值观的发展。改革考试评价的方式方法就要更新理念，探索运用更多的考试形式和方法。

实施灵活多样的考试评价方法，改变以往单一纸笔测验的方式，可以考虑根据语文学科的性质和教学目标引入口试，如背诵、朗读、理解表达等。注重引入表现性考试，教师可根据对学生基本素质的要求，设立反映学生情感和价值观的表现性考试形式，给学生展示特长和兴趣爱好的机会。例如，组织学生进行演讲比赛、社会实践等。考试形式多种多样，纸笔测验也应考虑改革。例如，倡导开卷的考试形式，开卷考试形式考察的重点在于学生分析和解决问题的能力，而不是强化记忆，教师在教学中要将日常测验演变成学习过程。一般而言，考试评价总是居高临下，评价对象处于被动地位，这种状况不利于学生的发展，他们不能很好地理解考试评价的意图，甚至为应付考试而不惜忽视被认为非重点的学习内容。改变考试评价观，教师应认识到调动学生积极参与考试评价是促进其发展的重要举措。对于学生而言，学习是终身的事情，要学会不断地利用考试评价的方式来了解自己的进步，分析自己的成绩，定向自己的发展。做到这一点需要学生对考试本身有一个深刻的认识，也需要积极地参与考试的整个过程，要清楚地认识到日常的考试不是为了选拔，而是通过测验促动学生学习，获得更好的学习效果。教师为了让学生主动进行自我考试评价，可以让学生自己出考题，为了让学生不断总结归纳自己的不足，可以给学生多次考试机会，进行差异性考试。

三、教学手段的改革

信息科技的发展，势必带来教学现代化的改革。现代化的教学手段最常用的是多媒体课件，它利用了计算机网络、投影仪、幻灯机、录像等方式，形成了视频、图画、文字、音乐等多种功能的知识传输系统，具有传统教学手段不具备的优越性，使用多媒体可以激发学生的学习兴趣。传统教学一般使用文字教科书、挂图、教师的口头语言和黑板书面语言等方式传授知识，比较单一、抽象，语文课文的丰富内涵和场景不能体现出来，学生往往学得枯燥乏味。而使用多媒体进行教学刺激了学生的感官系统，教师利用多媒体教学课件使课文场景形象逼真地呈现出来，使知识变得生动、形象，学生的学习气氛活跃，调动了其主动学习的积极性。多媒体的人机互动功能给教师和学生提供了良好地互动，教师可以通过Email和MSN和学生保持联系，可以帮助学生解答在课堂上没有理解的问题，与学生讨论问题，形成交互式学习。教师甚至可以和学生聊天，作为他们的良师益友，可以听听学生的心声，虚心听取学生对教师的评价。新课改下的教学不再是传统教育中的以教师为中心、以课堂为中心，而是以学生为中心。同时，学生可以自主上网学习，查找自己感兴趣的资料，进行网上练习等，锻炼了自主学习的能力。在运用多媒体的过程中，教师不能一味的“拿来主义”，要规避其不足之处，这样才能发挥其实效性，促进课堂教学。例如，过分地强调课件的重要性，认为只有使用课件才能把课上好，甚至认为板书都是多余的，教师成了一个点击鼠标的工具，电子板书占据了整堂课，学生不再认真做笔记，而更依赖于拷贝教师的教案。听觉和视觉成了一节课最重要的环节，忽视了亲手演练才是学生学习及巩固知识最重要的环节。教师在制作课件时，为了提高学生的学习兴趣，过多地加入了音乐视频及其他一些动画，虽然课堂气氛变得很活跃，但课堂的重难点并不突出，教师只顾埋头操作电脑，在课堂上缺乏与学生的沟通，无法对学生的行为进行有效监督，不能了解学生对知识的理解程度。所以，教师在利用多媒体教学时，要认真设计课堂教学计划，做到用现代化工具辅助教学，提高课堂效率的目的。

篇8

【关键词】财务管理；课程；考核

《财务管理》是大多数高校经济、管理类各专业的必修课程，也是其他多个专业的选修课程。本课程主要介绍财务管理的基本理论和基本方法，使学生对财务管理有一个基本的认识，领会财务管理在现代企业管理中的作用，并能为本专业的学习提供帮助。要求学生明确企业财务管理的目标以及货币时间价值、风险与收益等基本概念，掌握财务分析、投资决策、筹资决策、收益分配以及企业价值评估等理论和方法。

《财务管理》课程考核是教学评价的重要组成部分，对实现教学目标具有重要的督导作用。设置得当的课程考核有利于调动学生的学习积极性、培养学生的创新精神和创造能力，并对教学起到反馈、调节、评价和促进作用。那么应该如何安排课程考核，才能起到以上作用？在从事多年财务管理教学的基础上，笔者就以下几个方面谈一谈自己的体会。

一、实行分专业考核还是统一考核

以往本门课程考核时，考虑到各专业班级之间评分的公平与可比性，以及教师命题、评价的可操作性和效率性，一般都要求统一命题，统一考核。但基于以下原因考虑，笔者认为分专业考核更为合理：

首先，虽然各专业开设的本课程教学总体目标基本相同，但课程定位不同。对会计学、财务管理专业，该课程（也称中级财务管理）是核心课程；对经济管理类其他专业，该课程是专业教育必修课；而对于经管类以外的各专业，如语言类，社科、理工类各专业，则是为扩展知识面而开设的选修课。

其次，学时安排不同。会计和财务管理专业的本课程学时安排比较多，以本校为例，一般有中级财务管理48或54学时，高级财务管理48或54学时；其他经管类各专业，本课程一般安排48学时或54学时，不分中级和高级课程；经管以外各专业，一般设置为选修课，只安排32学时的课程。

再次，教学重点不同。对于会计和财务管理专业，重点在于财务决策、财务分析等方法的具体应用上。比如讲到项目投资决策部分，基本方法对这些专业的同学来说非常简单，只要介绍清楚就可以，而后面的不同寿命期投资项目的决策，设备更新决策、考虑折旧和所得税问题的复杂决策等才是研究的重点；但对于经管类其他专业的同学来说，由于会计方面知识学的比较少，复杂问题的决策不宜过多展开；而对于经济和管理类以外得各专业，重点应该放在基本方法比如贴现分析的几种不同决策方法上。

二、采用形成性评价还是总结性评价

形成性评价是指对学生日常学习过程中的表现、所取得的成绩以及所反映出的情感、态度、策略等方面的发展做出的评价，是在对学生学习过程的持续观察、记录的基础上做出的评价。形成性评价重视的是过程，具体可以采用观察、提问、作业、测验、问卷、案例分析、分组讨论等手段。形成性评价应设置得较为频繁，比如可安排一个章节或一个单元后的作业、小测验等。

在《财务管理》课程中采用形成性评价的好处在于：

首先，可以及时获得反馈信息，有利于教师改进教学。比如在课堂讲解的同时，通过观察学生对所讲内容的反应，了解学生对所学知识的理解情况，可以随时调整教学。

其次，促使学生及时掌握已学部分知识。如“货币时间价值”部分学习结束后，可以安排作业或者小测验，促使学生及时回顾课堂所学内容，并加深理解，为以后投资、筹资等单元的学习扫清概念理解和方法基础上的障碍。

再次，可以及时发现学生学习过程中存在的问题，比如通过提问、作业等发现部分同学在与折旧相关的现金流量分析上发生错误，教师可以对这部分内容重新讲解，学生也可以及时发现自己有哪些理解上的偏差，存在哪些错误，并根据教师讲评和自己的重新认识进行更正。

第四，增强学生学习积极性。通过教师的正面肯定，使学生通过情感反应加强了进一步学习的积极性，也通过学生的认知反应加固了其对正确概念、原理等的认识，校正了含糊的理解和不清晰的记忆。

第五，促使学生参与评价。比如在以往的教学中，安排问卷调查，请学生自己分析什么样的评价方式更为合理，同学们也提出了很多建设性的意见。

当然，形成性评价在应用时也存在一些弊端，比如：如果不把形成性评价的结果量化并计入到学生最终成绩中，学生的积极性和参与度不够，如果量化并计入最终成绩，其评价结果本身可能并不公允，比如提问时每位同学回答的问题不同；作业很难保证独立完成；分组讨论时部分同学不开口不参与；作业、测验的评价难以标准化；频繁评价的时间精力难以保证等等。

总结性评价则是在教学活动告一段落后，为了解教学活动的最终效果而进行的评价，也称为“事后评价”。总结性评价最常用的手段就是学期末的考试，其目的是检验学生的学业是否最终达到了课程教学目标的要求。

在《财务管理》课程中采用总结性评价的好处在于：

首先，可以考察教学目标的实现程度，考察学生掌握知识、技能的程度和能力水平。通过期末的考试可以考察学生是否明确企业财务管理的基本概念，是否掌握了财务分析、投资决策、筹资决策、收益分配、企业价值评估等的理论和方法，是否具备财务决策分析等能力。

其次，便于评定学生的学习成绩。总结性评价最常见的作用是评定学生的学习成绩，通过对学生达到教学目标的程度予以确定并打出分数，评出等级。

再次，对教师的教学提供反馈。教师可以从评价结果中获得有用的信息，了解学生对这门课程的掌握程度、存在的问题和难点，这些信息将会对教师下一次组织教学提供参考。

应用总结性评价也存在一些弊端：比如，学生不重视过程只重视结果，平时学习积极性不高，考试前临时抱佛脚；总结性评价有一次考试定终身之嫌，忽略了过程的考核；基于考核时间的限制，难以覆盖绝大多数知识点，也难于满足对学生创新和创造能力的考核。

在实际应用中，对《财务管理》课程考核应将总结性评价和形成性评价相结合。在形成性测试时，不要简单地只打分数，而应通过适当形式地让学生知道他是否已掌握了该单元的学习材料。如果学生掌握，应明确指出；如果没有掌握，也要尽可能予以鼓励并提出改进建议。在进行总结性评价时，要采用合适的考核形式，设定适当的考核难度，选用多种类型的考核题目，保证评价结果的客观、公正，能够反映出学生对知识和技能的掌握程度以及学生的能力。

三、采取开卷、闭卷还是论文形式

在总结性评价时，应该选用哪种考核形式呢？目前普遍采用的有闭卷考试、开卷考试和论文几种形式。

在《财务管理》以往的教学中，笔者和同事都倾向于采用闭卷考试的形式。从评分角度来看，闭卷考试确实有不少优点，更适合标准化评分。闭卷考试的特点是：第一，有利于直接考查学生的识记、理解和应用能力，也是对学生多方面基本能力素质的考查。第二，试题形式封闭，有利于培养学生思维的敏捷性和流畅性。第三，闭卷考试不允许学生携带任何与考试无关的资料和工具，不允许学生交头接耳，可能会给学生造成紧张的氛围，影响其发挥。

采用开卷考试，考生可以自由查看资料，但是仍应独立完成。与闭卷考试相比，开卷考试的试题更具开放性，更加灵活，为考生回答问题提供了充分的思考空间，有利于学生充分发表自己的见解，展现自己的能力，发挥自己的水平。开卷考试的特点是：第一，有利于考查综合能力素质。开卷考试时，试题的提问角度不是直接的，大多不是能从书面上直接找到答案的问题。第二，试题形式比较开放，只有对系列知识的融会贯通，才能灵活地驾驭问题的回答，进而发表个人的独特见解。第三，开卷考试允许考生翻阅随身所带的各种资料，考试环境相对宽松，能够减轻学生的考试压力。

以写论文作为考核形式，对教师来说，命题的工作量大大减轻；同时学生也没有考试压力；论文也比试卷更能反映学生的综合运用能力和创新能力。但是论文无法像闭卷或开卷考试那样，有比较大的考核知识点覆盖面，学生可以只选择自己比较熟悉或感兴趣的部分内容展开论述；论文写作时学生可以参考大量资料，有的同学会在网上下载大量资料照搬或者抄袭，对此难于完全杜绝；论文的评分不像试卷那样易于标准化，采用百分制评分并不太合适，也难以体现客观和公正。

对会计和财务管理专业，建议采用闭卷笔试的形式，考核内容覆盖面广，既考核财务分析，财务决策等的方法掌握程度，又考核基本知识点和背景知识了解情况，考虑到这些专业的同学多有参加注册会计师考试的需要，因此在题型安排和难度设置上可以部分参考CPA考试的情况，但对于CPA考试中未考察的实务以外的知识点等仍应考察。

对于金融、国贸、经管、市场等其他经管类专业，难度应该降低，考核基本概念、理论知识和复杂程度一般的分析决策等技能的掌握情况，另外考虑到和本专业结合的要求，可以采用开卷或闭卷笔试加论文的方式考核，开卷或闭卷笔试可以考察学时基本知识点和基本方法的掌握情况，论文又能促使学生结合本专业具体情况，选择部分问题展开研究。

经管类以外的各专业，由于是作为扩展知识面开设的课程，只要学生能了解基本理论，应用基本方法解决经济生活中的简单问题即可。因此只考核基本知识点，最基本的决策和财务分析能力，可以采用有条件的开卷考核方式。

参考文献：

[1]李宇,易松芝.财经类院校课程考试改革研究[J].当代教育论坛,2011(3).

[2]笪强生,翟晶.大学课程考核改革探索性研究[J].出国与就业(就业版),2010(19).

篇9

关键词：课程考核方式；改革；过程考核；全面评价

目前，我国高职院校《大学语文》课程的考核主要分阶段性测试与期中期末考核的方式，而一般情况下，大部分教师都采取作文考核或卷面测试的方式。作为传统考核方式，作文或卷面考核固然可以全面考核学生对所学知识的掌握程度，而且各种题型教师和学生都很熟悉，操作简单，因此沿用至今。但是这两种传统考核方式也存在许多弊端，如（1）“一刀切”的考核形式，无法满足职业教育“以能力为本位”的本质需求，只能考查学生对所学知识的掌握程度，而不能全面反映学生语文素质和能力水平。（2）没有针对不同阶段不同教学内容采取相应的测试形式，考试形式单一。（3）传统考核方式的评卷尤其是作文批改工作量大，必然导致效率不高，并且在分数的驱使下，必然会对语文课堂带来“功利教育”的负面影响，学生不重视平时学习，到期末考试时临时抱佛脚，不能真正体现学生的真实学习状况。这些都在一定程度上制约了教学水平和教学质量的提高，降低了学生对语文课程的学习兴趣，也影响了大学语文教学改革的深入推进。

为此，我院在不断推进大学语文教学改革的过程中，尝试进行课程考核方式改革，探索提升教学质量的有效方法，把考核贯穿到日常教学过程中，改变对学生“一次性评定”的方式，力求对学生的学习语文的过程中各节点进行质量控制，激发学生学习主动性，以更全面的评核学生的学习情况。现从改革理念、改革目标、改革内容以及结果和成效等方面来谈谈。

1改革理念

高职教育是素质教育和职业能力教育，教学过程尤其是评价过程对于学生学习态度和学习信心的促进都起到很重要的作用。要让层次不同的每一个学生都能主动发展，都能获得成功的体验，就必须改革目前这种终极式的、以知识再现为主的、一刀切式的考试模式，建立新的语文考核方式，突出过程评价、注重兴趣培养及能力训练，让每一个学生都在学习的过程中获得成功的情感体验，从而激发他们的主体精神。

2改革目标

我院大学语文已不再是空谈素养，简单学习几篇文章的所谓“高四语文”，而是根据高职学生需求，加强应用文写作和口语表达，把能力与素养相结合，已取得了较好的教学效果。本次考核方式改革项目试图从高职语文课程考核方式的变革入手，寻求解决传统语文教学模式、考核模式不足的方法，以期将语文课堂育人、能力培养的本质目标最大化。主要目标如下：

1）以我院高职语文“能力为核心”的教学理念为依据，现代教育测量理论为指导，合理编制高等职业院校语文考试评价模式，力求考核模式的科学性和适用性。2）培养学生平时学习的自觉性和创造性，建设踏实的学风，促使学生注重学习过程，充分利用平时时间努力学习，使学生在较短时间内掌握基础的实用写作及口语表达的技能。3）全面正确客观的评价学生的学习情况。能使我们真正的掌握学生的学习状态、看到学生的学习成果，检验自己的教学效果。

3考核内容

为配合大学语文的教学改革，切实提高教学质量，根据高职教育的培养目标和教学要求，我院基础课部语文教研室经过集体讨论，对现有的课程考试模式进行了改革，建立以“能力测试”为中心的考核模式，以充分发挥考试在教学和人才培养中的教育作用、引导作用和导向作用。具体方案如下：总评成绩=平时成绩（30%）+应用文写作环节成绩（40%）+口语表达环节成绩（30%）+奖励附加分。

考核方式的改革主旨是为了评价学生学习全过程，测试学生是否达到既定能力目标。

通过三个学期的实践，语文课程的考核方式已大致定型。前两个学期，我们取消了“期末考试”，设计了专用练习本，按照既定方案实施课程考核，分阶段、全过程地考查学生在“写作”和“口语”方面的学习情况。以“出勤率”、“平时作业”、“课堂表现”记录学生的平时成绩，“写作”成绩由一次随堂阶段测验和一次合作完成的任务书综合评定，“口语”成绩由演讲（拍摄视频上交）和一次课堂情景模拟综合评定，然后按照比例计入总分。最后为鼓励学生进行课外延伸学习，给学有余力，表现优异的学生进行适当加分，一并计入总分。

从这两学期学生的学习成绩看来，学生开始重视过程学习，作业水平有所提高，不及格率有所下降。但某些合作完成项目，仍存在部分学生浑水摸鱼的现象，为此，教师修订了练习本，要求学生在作业中注明本人在合作项目中为团队具体做出何种贡献，情况有所好转，公平性得到提升。

在考核方式改革实施过程中，我们通过及时反馈和总结，进一步对高职语文考核方式的可行性进行论证，不断改进考核方式。

第三学期，在大学语文教学改革不断深入探索的过程中，我们把“写作”+“口语”的模块化教学进一步深化为打破模块的“活动单导学”的教学方式，把“口语”和“写作”的教学内容融合在一起，以“活动单”为学生的学习指引，在一个活动项目中，结合与该活动有关的相关知识能力点，涵盖“说”“写”“素养”三方面内容。因此，原有的方案把“说”和“写”进行相对独立考核，显然已不够适合现有教学方式。因此，在第三学期，我们把考核内容稍作修改，在不改变“说”和“写”的能力指标评价的基础上，以“活动单”为单位进考核项目包含了任务完成、演讲视频、现场模拟、阶段性测验，采用“笔试”+“口试”的形式，对学生知识掌握（阶段测验）、能力应用（任务完成、演讲视频、现场模拟）和素养提高（团队协作、探索分析）进行了全方面的考评。

修订过的考核内容更多，计分更细致，也能更详细地对学生的学习状况作如实反映，评价更为全面。

4考核方式改革的创新点

（1）注重平时成绩、全面评价考生。前两年教学改革中实行的考核方式，虽然已经注意到了写作和口语的分项考核，相当程度改善了评价模式，但是由于期末考试成绩仍然所占比重较大，仍有部分学生存在平时糊弄，考前突击的现象，而有些同学认为做试卷才是考试，把学习的功夫过多用于考场上，记背理论知识，对平时老师布置的项目、任务却敷衍了事，甚至不重视口语测试，这些都不利于学生创造性和主动性的发挥，阻碍了创新思维的培养与发展。为培养学生学习的自觉性和创造性，促使学生充分利用平时时间努力学习，本学期我们经过集体讨论，结合我们的课程改革实际，决定期末不再举行大规模卷面考试，考核成绩分别由平时成绩、写作成绩、口语成绩组成，具体由平时作业、课堂表现、单元测验、项目操作、课堂实训等环节构成、设立相应指标体系和能力点，构建了一套相对全面、客观、合理的考核体系。这样的考核方式强化了学习过程的重要性，加强了对学生的学习过程评价，促使学生在平时多下功夫，逐渐积累，真正投入学习中，利于学校学风建设。

（2）考试方式多样化、考试内容侧重能力培养，改重写轻说为说写并重。传统的考试一般采用终结式考核方式，对于学生学习成果的检验仅来自于那一场考试，对学生的考核方式比较单一，经过了两年的教学改革，大学语文的考核方式已经作了较大改进：增加了口语考试，写作部分虽仍以试卷为主，但是以材料写作题为主，并采取了开卷的方式。在本次考核方式改革中，我们决定舍弃呆板的卷面考试方式，全力挖掘学生的学习潜能，弱化记忆性成分，强化学生对知识的实际应用能力，分析和解决问题的能力，允许学生以合作者身份介入命题，采用完成任务书，操作项目、角色扮演等多种新型考核方式。

（3）建立良好的反馈机制。在原来的教学过程中，由于考试是期末一次性终结考试，学生考试结束，就意味着本门课程学习的终结。考试中存在的问题，教师不能与学生进行反馈与交流。学生不知道自己差在哪里，不明白的问题一直是问题，而任课教师也难以在教学中及时了解学生对知识的掌握程度，不能了解学生为何会出现那些问题，也就无法对教学做出必要的调整。本次改革后，由于设立了分阶段的测验和完成任务书，每次测验后或者完成某项任务后教师都能及时把测验情况和任务完成情况反馈给学生，存在的问题老师能很好的跟学生进行交流，学生能有所收益，而反馈过程也为任课教师改进教学提供了参考。学习成为了一个良性互动的过程。

5考核方式改革的结果与成效

（1）考核方式改革后真正体现了对学生知识、能力、素养的全面考核。例如：单元测验从学生知识体系入手，采用开卷形式、考题设计以知识为基础，能力考核为主旨。活动单的完成全面考查了学生分析问题、解决问题的能力，在考核过程中，学生团队协作、自主钻研等素养得到全面提升，奖励积分的方式促进学生不算自我完善、自我加压，在课外继续进行延伸学习。

（2）改革后的考核方式突出过程评价、注重兴趣培养及能力训练，让学生们都学习的过程中获得成功的情感体验，从而激发他们的主体精神。例如：学生文字表达作业在校报上集结发表（校报某期副刊专版、近期校报又会发表），激发了学生的学习兴趣，获得成功体验，有利于学生学习积极性的提高。学生通过团队协作完成活动方案，在全班展示，有的甚至在生活中付诸实施并获得成功，学生主体精神得到全面发挥。

（3）新的考核方式获得学生好评。在考核方式改革的两年中两次对语文学习开展问卷调查，问及“你觉得改革后的考核方式如何？” 绝大部分的学生都认为新的考核方式“较好的考核了学生的总体学习情况”。每学期的师生座谈会上学生对于考核方式改革均给予大力肯定，他们认为，这种考核方式较为公平全面地体现了他们的学习状况，并且通过这样的考核方式，培养了他们多方面能力，比如团队协作能力、口语表达能力、探索研究自主学习的能力，使他们更喜爱语文课程的学习。学生在考核中完成了活动方案的制作、演讲视频的拍摄、个人营销等能力展现。

（4）学生成绩有所提高，不及格率降低。从三学期的成绩统计看来，学生在适应了新的考核方式后，学习兴趣增强，学习主动性得到提高，总体成绩逐步上升，不及格率较以前有较大幅度的降低。

课程考核是为了了解学生对知识的掌握和运用的教学效果。合理的考核方式能引导学生进行自主的研究性学习，发挥考试的诊断、评价、反馈、导向和激励的功能，促进教学改革的深入发展。因此，我们只要潜心研究，大胆探索，不断总结提高，就能摸索出一条适合高职人才培养需求的考核方法，进一步促进我院大学语文教学改革，从而达到我院“给予能力，以人为本”的人才培养目标。

篇10

（一）文件筐测验的概念

所谓文件筐测验，也称公文处理测验，属于情景模拟面试方法的一种，是评价候选人能否胜任特定管理岗位的常用情境模拟技术之一。公务员面试文件筐测验手段最初来自于企业选拔领导干部时常用的方法，目前广泛应用于领导行为、培训、工作满意度、绩效评估、组织公民行为、组织信息加工、决策、压力管理、组织气氛等诸多领域的研究。

公务员面试的主要目的是要考核考生的基本素质是否与公务员岗位要求相匹配，尤其要考核考生处理公文的能力。由于申论目前采用提出问题、分析问题与解决问题的模式，在一定程度上不能充分地考核考生处理公文的能力。而文件筐测验方法则恰恰是针对这一缺陷而设计的面试方法。

在公务员面试中，文件筐测验往往用于在限定角色、限定时间、限定背景、限定条件的前提下，通过要求考生处理诸如记录、报告、请示、声明、通知、总结、函电函件、备忘录、待审批签发的文件、统计资料和报表等日常公务来考察被试者的计划、组织、预测、决策和沟通等能力。一般只给日历、背景介绍、测验提示和纸笔，考生在没有旁人协助的情况下回复函电，拟写指示，做出决定，以及安排会议。评分除了看书面结果外，还要求考生对其问题处理方式做出解释，根据其思维过程予以评分。

（二）文件筐测验的特点

文件筐测验把被试者置于模拟的工作情境中去完成一系列的工作，与通常的纸笔测验相比，较能反映被试者的真实能力水平。与结构化面试、无领导小组讨论等其他测评技术相比，它提供给被试者的背景信息和测验材料以及被试的作答都是以书面形式完成的，一方面考虑到被试者在日常工作中接触和处理大量文件的需要，另一方面也为每一位被试者提供了工作的前提条件和机会相等的情境。文件筐测验可以同时对大批量的被试者进行测试，这也是其他情境测验方式所无法比拟的。

文件筐测验是评价担任特定职务的管理人员在典型职业环境中获取、研究有关资料、得体处理各类信息、准确做出管理决策、有效开展指挥、协调和控制工作能力及其现场行为表现的综合性测验。文件筐测验作为评价技术手段体系的一个重要组成部分，一直被认为是选拔领域有效的甄选工具之一。与其他面试方法相比，文件筐测验具有全面性、针对性、准确性、公平性、复杂性、难以把握等特点。

1．全面性

文件筐测验要求考生在限定条件下，迅速准确地处理一系列公文，这就要求考生必须全面调动自己的知识储备与经验积累，不仅仅是要保证公文格式的完整准确，而且还必须能够对特定文件所涉及的背景知识（如业务知识）、操作经验以及其他能力要素有全面的把握。也就是说，考生在考场强刺激环境下，必须能够迅速调用自己与待处理文件有关的一切要素，才能够取得优秀的成绩。而且公文筐测验是一套公文的组合，可以同时从多个维度上评定一个人的管理能力，这些能力是知识、经验和智力相互作用和整合的结果，具有综合性。

2．针对性

结构化面试和无领导小组讨论往往存在一个共同的缺陷，即考试题目常常陷入过于抽象、过于笼统、过于概括的境地，这种笼统性使公务员面试的针对性在一定程度上有所弱化。从而导致考试本身的信度与效度也随之下降，不利于选拔符合职位岗位要求的最佳人选。而文件筐测验则不同，题目一般都会具有很强的实践性与操作性，针对某一个或某几个特定的公务，这些公务都是考生在进入工作岗位之后常常要处理、要面对的公务。考生在考场上的表现，在一定程度上能够反映出考生在进入工作岗位之后的表现。

3．准确性

文件筐测验最大的优点在于其具有较高的表面效度，它模拟的是真实工作情境，测验材料是实际工作的样本。作为一种情境模拟技术，文件筐中有的公文材料采用手写体，有的函件采用报考单位的信笺书写，这使其具有较好的模拟效果，比传统的认知测验和人格测验更能吸引被试者投入测试，也有利于考官根据考生的处理态度、处理方式、处理结果来直观而准确地判断考生潜在的素质是否能够与职位岗位要求形成最佳匹配。文件筐测验高度仿真和接近管理实战，非常有利于激发被测评者的积极性和创造性，对于在很短的时间内全面、准确掌握管理者的能力、潜能以及个性心理特征的某些关键要素具有不可替代的重要作用，是不折不扣的“管理者实战演习”。两小时左右的文件筐测验对被测评者自身综合素质状况、工作经验积累、专业知识和相关知识的系统整合与娴熟应用的考察效果为其他许多人事测验所望尘莫及。据统计，欧美发达国家和日本在选拔、评价管理人员时最常用的技术就是评价中心，而评价中心中文件筐测验的使用频率高达95%。文件筐测验效度和信度极高（信度相关系数为0.92）。研究表明文件筐测验具有良好的内容效度。虽然文件筐在测验过程中采用的是静态的考察方式，但是其材料包罗万象，范围广泛，任何静态的测评要素，比如背景知识、专业知识、操作经验以及能力倾向等都可以隐含于文件之中，通过文件处理这种形式对被试者的潜在能力和综合素质进行考察。

文件筐测验中的成绩与实际工作中的表现有很大的相关，对被试者未来工作绩效有很好的预测能力，即该测验具有良好的预测效度。因此，只要被试者能够妥善处理文件筐中的各类文件，评价者就有理由认为被试者在一定程度上具备了胜任新职位所需要的素质。西方有研究者观察了51人的工作实际绩效后发现，工作绩效与文件筐测验之间的相关度高达0.42；还有人发现文件筐测验的绩效与日后三年内的晋升之间的相关度为0.32。

4．公平性

文件筐测评的技术手段，与其他面试手段不同，它常常采用团体测评的方式。所有考生同时对一个文件筐进行处理。由于这种处理一般都是以书面形式完成的，因此基本上可以排除相互之间的影响和干扰，也排除了结构化面试入场次序不同所导致的不公平现象（比较典型的是：结构化面试中，最后一个入场接受测评的考生，在表现相同的情况下，成绩往往会比先入场的考生要低，这与考官的心理变化有关）。与结构化面试考官独立打分不同，文件筐常常由考官组进行讨论之后，才对考生的表现做出综合评价，这有助于提高公文处理的信度。

5．复杂性

文件筐测验的复杂性体现在专家命题、培训考官、考生答题、考官评分整个面试过程。专家在命题的过程中，必须考虑到考生所报考职位的特点与要求，考虑到题目所涉及的公务在日常工作中的代表性与全面性，还要尽可能降低外在因素对准确判断考生潜质的消极影响，很大的题量、很长的考试时间，对考官自身的素质提出了较高的要求，采用文件筐测验，会使得面试时间成倍地增加，也使得面试的成本大大增加，这无疑也加大了面试的难度。

6．评分的困难性

由于文件筐测评具有很强的针对性，因此就不仅仅对考生的素质提出了更高的要求，对考官评分的要求也大大提高。在我国公务员面试中，考官组成的规则决定了同一个考官要对大量报考不同部门不同职位的考生进行面试与测评。而不同部门、不同职位所面临的日常公文又具有一定的区别，考官很难对所有部门与职位的日常工作都相当了解，加之个人素质、机构性质、工作理念的差异，使得文件筐测评从工作分析、能力分析到选择材料、题目成型，都存在着较大的困难。

一份文件的处理，除了个人素质的原因外，机构、氛围、管理观念等不同的组织，具有不同的评价标准。显然政府机关与公司企业、私营企业与国有企业对有关文件的处理是大相径庭的。在我国从事实际工作的人们往往缺乏对招聘单位管理或经营状况的深入了解，因而文件如何处理才能充分表明考生具备招聘职位所需素质，专业人员与实际工作者往往存在理解上的差异。因此，评分不容易把握。

二、文件筐测验的题目编制

文件筐测验的题目编制与结构化面试大同小异，除了共性之外，其题目编制还有以下几个特点：

（一）工作分析

工作分析是文件筐测验题目编制的第一步，也是文件筐测验题目编制的根本指针。命题人需要根据招考职位说明书，对各个与文件筐测验相关职位工作的特点、必备的知识、经验、能力进行充分的调研了解，以便题目的编制能够充分体现出招考职位的素质要求。工作分析的方法可以是面谈、现场观察或问卷。通过工作分析，命题人基本上可以确定文件筐测验需要测评哪些要素，各个要素能够得到测评的程度以及所占权重。

文件筐测验一般可以考查以下要素：

1．书面表达及其理解；

2．统筹计划能力；

3．组织协调能力；

4．洞察问题和判断、决策能力；

5．任用授权能力；

6．指导控制能力；

7．岗位特殊素质，如法规条例知识。

（二）文件设计

在进行了充分的职位调研，确定需要测评的要素及所占权重之后，命题人就需要进行文件设计的工作。文件设计工作的第一步，是选择文件种类，例如报表、备忘录、批示、请示、信函、通知、报告等。一般情况下，命题人可以选择其中的一个文件种类，如统计报告，也可以选择几个文件种类进行组合式命题。文件设计工作的第二步，是确定每个文件的具体内容，如文件假定的背景（包括考生的身份设定、考生所处场景），文件的具体要求、具体格式，工作的具体内容。如果文件数量较多，则时间以2～3小时为宜。文件的签发方式及其行文规定可以忽略，但文件的行文方向（对上与对下，对内与对外等）应有所区别，特别要注意各个文件测评要素的设计。一个文件不同的处理常常可以体现不同的要求，对文件的处理方式要有所控制，确定好计分规则或计分标准，要求测评要素与评分标准做到一一对应，须尽量避免一个测评要素对应两个及两个以上评分标准，或者测评要素与评分标准无法对应的现象。

整个文件筐测验的设计要特别注意两点：

一是测验材料难度的把握。目前国内对各个职位应具备何种程度的知识、经验和能力缺乏客观可靠的依据，难度的把握比较困难。把握不准，材料过易或者过难，都容易导致考试成绩缺乏科学的区分度，不利于选拔最优秀的人才。

二是要注意材料真实性程度的把握。完全杜撰的材料，考生可以根据一般知识推理，处理的结果没有针对性，看不出考生的水平差异，考生被录取后需要经过较长时间的培训和适应才能胜任工作。完全真实的材料，过于偏重经验的考查，忽视潜能的考查，最后选拔到的人无疑是完全与招聘单位文化气氛相同的人，违背了引入外来人才、给单位输入新鲜血液的本来目的。同时完全真实的材料，使招聘考试本身对单位内部考生和单位外部考生不公平，同样的能力水平，内部考生被录取的可能性更大，结果给人留下“一切都是内定，考试不过是走形式”的印象，这对真正想引进外部人才的单位尤其不利。

三、文件筐测验的实施

文件筐测验可以单独测试，但为了节约时间和成本，也可以集体施测，实施过程分准备、测试和评分三个步骤。

1.准备

主要指测验材料和测试场所的准备。给每个考生的测验材料，事前要编上序号，答卷纸也要有相应序号，实施前要注意清点核对。答卷纸主要由三部分内容构成：一是考生姓名（或编号）、应聘单位和职位、文件序号等；二是处理意见（或处理措施）、签名及处理时间；三是处理的理由。文件序号只是文件的标识顺序，不代表处理的顺序，应允许考生根据轻重缓急调整顺序，但给所有考生的文件顺序必须相同，以示公正。测试的场所要求比较宽敞、安静，每个人一桌一椅，相互之间无干扰。为了保密，最好所有考生在同一时间完成。如果文件内容涉及到招聘单位内部的一些情况，测试前应对所有考生提供培训，介绍相关情况，缩小内部考生和外部考生对职位熟悉程度的差别。

2.实施

篇1

篇2

篇3

篇4

篇5

篇6

篇7

篇8

篇9

篇10

热门标签

相关文章

相关期刊

水文

影像诊断与介入放射学

上海精神医学

时事资料手册

精品范文