时间:2023-05-16 16:18:42
序论:好文章的创作是一个不断探索和完善的过程,我们为您推荐十篇教师评价方法范例,希望它们能助您一臂之力,提升您的阅读品质,带来更深刻的阅读感受。
教学工作的特殊性使衡量和评价教师的教学水平不仅是一个棘手的实践问题,也是一个理论难题。当教师的授课极具魅力,能够吸引学生听课,能够将复杂的理论变成通俗易懂的内容,其讲解能够与学生达成某种一致的时候,学生乐于听讲,这是否就可以说该教师的教学水平高呢。事实上,现实中往往存在以下几种情况:
一是教师的科研水平非常高,讲授的课程也非常受欢迎。这是任何人都会表示支持的情况。在大学里,能够将科研与教学都做得很完美的教师,可以说是非常少见的。
二是教师的科研水平非常高,但其讲授的课程并不受学生欢迎。我们知道,一个教师的科研水平高,是以一定的时间投人为代价的。这样一来,该教师就不可能有更多的精力去钻研教学。有时候,科研内容与教学内容是不一致的,教师科研的内容并不一定是学生感兴趣的,那么教师的教学效果就难以保证。即便教师的教学内容与其科研对象是完全统一的,仍然无法将两者统一起来。因为科研惯常使用的是逻辑思维,运用的工具是抽象术语,采用的是书面化语言和叙述方式。而教学活动使用的是口头语言,且不能出现大量生僻的概念术语。逻辑思维虽然是必要的,但不一定占主导地位,于是便会出现教学语言与科研语言不一致的情况。可见,科研与教学有时候是有冲突的。
教学上,教师应该是居于客体的地位,而非主体的地位,因为教学是双边活动,而不是教师单边的活动,教师必须根据情境条件进行教学设计。而在科研中,教师的思维可以是非逻辑的、跳跃式的,这种方式不能应用于教学活动中。
三是教师的科研水平不高,但是讲课善于煽情,能调动学生的参与热情,学生往往认为这些课程是最好的。必须承认,这部分教师善于形象思维、善于语言表达,这是他们的优势;但从知识的深度和广度而言,他们还达不到要求,也很难搞出科研成果。但是这部分老师却非常善于知识传播,他们能以学生理解知识的方式进行教学,比较适合学生的口味,所以很受学生的欢迎。
那么,受学生欢迎是否是评价教学水平的根本标准呢?要探讨这个问题,必须涉及另一个更为根本问题,即教学的目的是为了知识传授还是为了学生的发展?因为这两者并不完全统一。知识传授是指最新知识的传授,而不是固定知识的传授,这是大学教学和中小学教学的根本差异所在。可以说,对教学水平进行高低评价是很难的,我们不能运用一些简单化的方式来进行评价,必须考虑影响教学效果的多重因素。
二、现有教学水平评价方法的局限性
从现有的高校教学水平评价方法看,其局限性是相当明显的,其准确性受到各种因素的影响,所起作用较为有限。高校一般采用教师授课、学生打分为主。学校制定评价标准,确定分值,学生根据评估标准进行打分,最后累加总分加以平均。这种评估形式最大的弊病就是随意性较大,对教师和学生双方缺乏必要的约束,有时会造成师生之间的矛盾对立。
从学生方面说,对自己较为喜欢的教师,打分一般较高,而不甚喜欢的教师打分相对较低。为了获得较高的分数,教师只要平时注意和学生接近即可达到目的。据笔者近几年来对福建师范大学的调查发现,学生对教学水平评价的重视程度呈逐年递减的态势。一年级的学生最为认真,82%的学生都能根据评估表格标准认真打分,评价结果基本真实可靠;二年级学生态度次之,仍有61%的学生认真打分;三年级学生中,认真打分的学生只占30%,有30%的学生是胡乱打分,40%学生持无所谓态度;四年级学生打分最不认真,认真给教师打分的同学不到20%,50%的学生是胡乱打分,余下的同学则干脆弃权。学校对不认真打分的学生是没有办法加以约束的。
“百年大计,教育为本。教育大计,教师为本”。教师队伍的素质是学校教育水平的决定性因素之一,而这两者都是当前教育研究的重中之重,这就使教师评价成为教育界备受关注的问题。“即使在非常具体的课堂背景下,也没有人确切地知道,在影响优秀学生的学习上,教师应扮演什么样的理想角色”[1],虽然从教师职业产生之日起,对其评价就已经产生,但由于教师职业的特殊性和教育工作的复杂性,教师评价工作真正走上科学化、规范化的轨道还起步较晚。从20世纪中叶以来,正式的教师评价开始在西方发达国家产生,我国教师评价开始于60年代,直到80年代后才有比较正式的评价[2]。目前,我国教师评价已有一定的发展,但中小学教师评价工作相对于大学教师评价工作还存在发展不足的问题。本文着重对中小学教师评价工作进行探讨,并提出一种新的学生评价教师的方法――毕业生追踪评价法。
一、中小学教师评价现状及问题
1998年12月国务院批转了教育部颁发的“面向21世纪教育振兴行动计划”,其中《跨世纪园丁工程》强调了提高教师基本学历、加强在职教师职后培训和骨干教师培训等工作,对中小学教师继续教育和骨干教师培训提出了明确要求;1999年6月,国务院举行的全国教育工作会议发表了《关于深化教育改革全面推进素质教育的决定》,提出建设高质量的教师队伍是全面推进素质教育的根本保证。一系列相关政策法规的推行,使教师评价工作在我国各级各类学校中普遍实施。目前,中小学教师评价工作已走上规范化轨道,并形成了相应的制度与实施方案。然而根据有些学者的教师问卷调查与对校长重点访谈的结果分析发现目前中小学教师评价制度有以下主要特征:1.评价主体以校长为主;2.以学生的考试成绩作为主要评价内容;3.现行教师评价对教师专业发展关注较少;4.现行教师评价对教师关爱较少;5.教师喜欢与自己深入交谈后再做评价;6.教师评价影响教师的积极性,给教学工作带来不利影响[3]。结合现实,可以总结当前中小学教师评价工作的突出问题有以下几点。
1.评价主体的单一性
在教师日常工作中,需要与学生、家长、教研组、其他同行及学校领导打交道,为了完整全面地评价一位教师,真实反映其综合素质,需要从不同角度进行了解。传统教师评价以他评为主,评价主体主要是教育行政部门及学校,这种评价把教师教育活动的实践者排除在评价活动之外,忽视教师的情感需要、特点,造成教师教学积极性下降,甚至出现敌对情绪[4]。由于一些客观因素的限制,如中小学生心智尚未成熟,缺乏理性评价能力等,加之缺乏对学生主体地位的认识与尊重,使学生评价在教师评价工作中的缺失。然而,有些研究指出这种观念是错误的,高中学生评价教师是合理有效的[5]。
2.评价标准的刻板性
长期应试教育体制导致学校教育教学工作一切以“分数先行”,体现在中小学教师评价中过分强调学生成绩。不少学校将学生成绩、升学率、合格率作为教师选聘、晋升、评奖等最重要的指标,不仅有悖于素质教育全面发展的宗旨,忽略学生多样性发展的需求,还使教师评价走上歧途,失去最初意义。这样畸形的评价指标忽略教师的积极性、创造性,以及师生关系等一系列重要内容,容易挫伤教师教书育人的热情,产生职业倦怠。
3.评价目的的功利性
教师评价作为教育评价的一个重要组成部分,其实施目的有两个方面:一是改进教学,提高教学效能;二是促进教师专业发展。但是,目前我国教师评价关注更多的是提高教学效能,这是因为当前社会的价值取向决定了学校的生存方式和发展前提就是不断提高分数和升学率[6]。评价目的作为评价活动的指导思想,贯穿评价活动的全过程,如果指导思想出现偏差,就不能得到客观公正的评价结果,同样不能发挥教师评价的真正作用。
4.评价结果的失效性
学校对评价结果的使用频率最高依次为:评优评奖金的依据、指导教师改进教学工作、教师职务评定或认识调整的依据,最后才是确定教师参加培训的需要。而这些目标是否能实现,则是另外一个问题。但是通过调查发现,当前中小学学校大多只是简单地将评价结果张榜公布或者只告诉教师本人,无视教师专业发展需要和教师对评价结果的反馈,很少组织专业小组诊断和指导教师专业发展。由此看来,当前中小学对评价结果的利用效率还比较低,需要继续深挖其用途以更好地促进教师专业发展[7]。
5.评价方法的简单化
调查显示,当前中小学学校教师评价主要是总结性评价,更多作为奖惩依据,很少使用诊断性评价和形成性评价以促进教师专业发展。反映出当前中小学教师评价在很大程度上只是每学期结束时的一项例行工作,还没有做到以促进教师专业发展为目标。此外,过分强调量化是当前评价方法有失偏颇之处,为了使评价结果的效用得到最大限度发挥,应该适当结合质性评价,给予教师更多帮助与指导。
二、学生评价在中小学教师评价中的意义与困境
针对以上分析结果,本文着重从评价主体角度阐述学生在教师评价中的重要地位,以及其在中小学教师评价工作中实施的困难因素。学生作为教师评价主体近年来深受关注,其被广为接受的原因在于学生是教师教学的最直接见证者和教育效果的体现者,对教学有最广泛深刻和最直观的感受。同时,教师作为教育服务的提供者,“忠实于服务对象”是教师的专业特征和原则,而学生作为相对而言的“顾客”,理应有“挑剔”或评论的发言权[8]。因此,学生做出的描述评价作为第一手资料具有高度真实性、可靠性和全面性。
除此之外,学生评价教师对师生双方都具有积极意义。学生可以在评价教师的过程中感受到自身的价值,体会其作为教育教学活动的主体地位,提高主人翁意识和责任感。教师可以通过倾听学生了解自身不足以努力弥补,或发现自己闪光点提升自信心与教学热情,由于学生对课堂教学有直观而全面的了解,对提高教师专业技能具有十分现实的意义。由此可见,让学生参与教师评价既具有理论意义,又蕴含现实意义,应该在每个教育阶段大力推广。由于中小学生的特殊性,不少人对参与教师评价的意义及作用产生怀疑。学者赵德成将反对者的声音归结为以下方面:中小学生的评价意见未必客观、准确;学生评教工具的诊断意义是有限的;学生评教并未有效促进教师改进工作;将学生评教结果与某些高利害决策联系起来有失公平[9]。可以看出,第一点是导致第二、三两点的重要因素,第四点则涉及评价结果的使用情况,不属于本文讨论的范围。针对第一点限制因素,本文试图从评价方法角度对传统意义上的中小学生评价教师方法有所创新和补充,即评价中小学教师的学生不仅是目前的在校中小学生,还包括大学生,甚至是刚刚参加工作的毕业生――毕业生追踪评价法。
三、毕业生追踪评价法
1.基本含义
毕业生追踪评价法是相对于现行学生评教方法而言的,它的评价主体不是正在中小学接受教育的中小学生,而是已经从中小学毕业的人,他们可以是大学生、研究生,甚至是已经参加工作的成人。由于评价主体的变化,它的评价指标和中小学生评教内容有所不同,不再过分注重描述性评价,即不力求了解一些教学细节,而是更强调对教师的整体评价,尤其是师生关系、教学能力及风格和教师的人格品行。实施这种评价方法的目的不再是简单地进行奖惩,而是更注重促进教师专业发展及人格完善。
综上所述,毕业生追踪评价法是一种让毕业生回忆对以前中小学教师进行评价的方法,着重考察教师的道德操守、教学能力及风格及师生关系,从而实现发展性评价对促进教师自身完善的作用。毕业生追踪评价法可以作为中小学学生评价教师方法的一种补充,在实际工作中得到新的发现与感悟。
2.优越性及局限性
毕业生追踪评价法与现行学生评教方法相比有以下优点。
(1)毕业生作为成年人,具有较成熟的心智、判断能力和评价能力,对教师工作性质与要求有充足的认识,能够理智客观地对教师进行评价。由于毕业生和教师已经没有利害关系,也能更公正公平地进行评价,不会因为担心影响自己的成绩或对个别科目的教师抱有偏见而进行虚假评价。此外,由于成年人的知识积累和生活阅历对教师工作中不足之处能够提出有益建议,对被评教师而言是值得思考的。
(2)毕业生通过回忆方式对教师做出的评价是整体性评价,因此其重点不是具体描述课堂教学、作业布置等详细情况,而是从回看高度对教师整个人物的教学评价。这样得出的结论多是关于教师教学能力及风格、人格素养和师生关系,或让毕业生感触颇深的一些事。教师对学生最深远的影响应该是教师的人格,而不是教师当时所教的书本知识。因为随着时间的流逝,书本知识会慢慢模糊甚至遗忘,而同时随着人生阅历的积累,教师优秀的人格会在学生脑海中越来越清晰、闪光。由此得到的评价结果对教师而言,不论是赞美多还是建议多,都是一份极具价值的成绩单,从这之中,教师可以看到自己的成长与进步,收获学生的感恩,同时让教师认真反思自我。可以看出,从发展性评价标准衡量,这种方法有利于促进教师专业发展。
(3)由于该方法得到的结果将不会与教师的晋升、调动等切身利益直接挂钩,更多的是给教师提供自我反思的机会,因此不会对教师造成压力和紧张感。同时,除了与毕业生没有利害冲突之外,这种方式往往能引起其兴趣,从而在愉快轻松的氛围下完成评价工作,而不是像以前抱着完成任务的心态敷衍了事。与以往奖惩性评价让教师积极性降低,甚至有抵触情绪,让学生只用几分钟完成十几个选择题,却完全不明白评价的意义相比,该方法将会受到师生欢迎。
该方法的不足之处在于由于时间久远,毕业生对某些教师的记忆可能相当模糊,因此不能做出准确的评价。此外,中小学组织该评价工作时联系相应毕业生存在一定困难,有时很难保证参评人数,这就对结果造成影响。最后,由于该评价注重质性描述,因此评价指标难以明确界定或者整齐划一,这些都是在实际操作中需要解决的问题。
3.相关注意事项
(1)正确对待毕业生追踪评价法的地位。应该明确毕业生追踪评价法不是对现行学生评教方法的否定,与此相反,它作为一种补充,开拓了一片新领域,目的是让学生评教更好地发挥应有之意,在校学生评教仍将是学生评教的主要方法,不能本末倒置。
(2)科学处理评价结果。当学校收到毕业生反馈的评价结果时,最后如何处理关系到整个评价工作的成效。首先要确保该评价结果不与教师晋升、调动、加薪等切身利益相关,更多的是给教师一个自我反省、自我评价的机会,营造轻松的氛围,减轻教师的压力。
(3)力求评价过程的简洁。虽然大多是质性评价,而不是简单的选项,需要评价者花费一定时间精力完成,但评价内容设置不能过于繁琐冗长,以免给评价者造成精神压力从而产生厌烦感。因为这种特殊的评价,需要在愉快的心情下得到最真实详尽的答案。
毕业生追踪评价法目前还只是一种理想想法,其有效性还需要经过实践检验才能得到最后证实。但它反映的突出学生主体地位的精神,重视学生参与学校公共事务中的价值的思想,需要贯彻每一个教育活动中,值得每一个教育工作者反思。
参考文献:
[1]Shinkfied,A.T. & Stufflebeam[D].Teacher evaluation:Guide to effective practice,Boston:Kluwer Academic Publishers,1995.
[2]蔡永红,黄天元.教师评价研究的缘起、问题及发展趋势[J].北京师范大学学报(社会科学版),2003(1):130-136.
[3]杨传昌,蒋金魁.我国中小学教师评价制度研究综述[J].教育探索,2009(3):59-60.
[4]徐家勤.论当前我国中小学教师评价机制中存在的问题及对策[J].河南机电高等专科学校学报,2010(5):61-62.
[5]Aubrecht,J. D.,Hanna,G.S. & Hoyt,D.P.Acomparison of high school student ratings of teaching effectiveness with teacher self-ratings:Factor analytic and multrait-multimethod analyses,Educational and Psychological Measurement,1986,46(1):223-31.
[6]王忠荣.普通高中学生评价问题个案研究[D].长春:东北师范大学,2012:4.
教师自我评价的内容是很多的,主要可以从以下几个方面进行:师德、日常教育教学工作、专业成长、人际关系(包括和学生、领导、同事、家长)。本文仅从课堂教学这方面来进一步谈谈如何进行自我评价,因为课堂教学是教师自我评价的重中之重。课堂教学评价可以分为:每一节课的评价、学期阶段评价、教研阶段评价。
(1)每一节课的评价应该成为教师日常的工作中的一部分。它又可以分为三个环节:一是课前自评。课前自评是在认真充分备课后,对所备课的设计与构思进行研究分析,看看所设计课的内容与教法、学法是否能达成教学目标,教法与学法是否适合于教学内容,所要达成的目标是否适应学生的发展需要。二是课堂自评。课堂自评是在课堂教学过程中,对一堂课的一个部分和片段进行研究分析,看看是否达到预期的目标,还有哪些地方需要改进,学生是否能积极主动地参与到学习活动中来。需要改进的尽可能在教学过程中作出改进,存在的问题能弥补的也尽可能及时弥补。三是课后自评。课后自评是在一堂课结束后,对这堂课的每个环节进行全面细致地分析研究,总结上课情况,看看是否达到预期的效果,针对在课堂上出现的问题分析出现问题的原因,找出解决问题的办法。
(2)学期阶段评价主要是针对课堂教学一学期来的情况进行评价:教学内容是否完成、本学期应该掌握的学科知识学生是否牢固掌握、学生的学科能力和学科兴趣是否有所提高、自己的教学行为方式是否有效,都应一一自我评价或在学生的协助下进行自我评价。
(3)所谓教研阶段评价,就是针对自己在教学中进行改革情况的评价。作为一名教师如果要获得专业化发展,必须要进行教学科研和教学改革。每一个学期或每一个学年都要对自己的教学科研和教学改革情况进行评价。找出改革的成功之处和失败之处,进一步思考,以便将教学科研健康地进行下去。
教学工作的特殊性使衡量和评价教师的教学水平不仅是一个棘手的实践问题,也是一个理论难题。当教师的授课极具魅力,能够吸引学生听课,能够将复杂的理论变成通俗易懂的内容,其讲解能够与学生达成某种一致的时候,学生乐于听讲,这是否就可以说该教师的教学水平高呢。事实上,现实中往往存在以下几种情况:
一是教师的科研水平非常高,讲授的课程也非常受欢迎。这是任何人都会表示支持的情况。在大学里,能够将科研与教学都做得很完美的教师,可以说是非常少见的。
二是教师的科研水平非常高,但其讲授的课程并不受学生欢迎。我们知道,一个教师的科研水平高,是以一定的时间投人为代价的。这样一来,该教师就不可能有更多的精力去钻研教学。有时候,科研内容与教学内容是不一致的,教师科研的内容并不一定是学生感兴趣的,那么教师的教学效果就难以保证。即便教师的教学内容与其科研对象是完全统一的,仍然无法将两者统一起来。因为科研惯常使用的是逻辑思维,运用的工具是抽象术语,采用的是书面化语言和叙述方式。而教学活动使用的是口头语言,且不能出现大量生僻的概念术语。逻辑思维虽然是必要的,但不一定占主导地位,于是便会出现教学语言与科研语言不一致的情况。可见,科研与教学有时候是有冲突的。
教学上,教师应该是居于客体的地位,而非主体的地位,因为教学是双边活动,而不是教师单边的活动,教师必须根据情境条件进行教学设计。而在科研中,教师的思维可以是非逻辑的、跳跃式的,这种方式不能应用于教学活动中。
三是教师的科研水平不高,但是讲课善于煽情,能调动学生的参与热情,学生往往认为这些课程是最好的。必须承认,这部分教师善于形象思维、善于语言表达,这是他们的优势;但从知识的深度和广度而言,他们还达不到要求,也很难搞出科研成果。但是这部分老师却非常善于知识传播,他们能以学生理解知识的方式进行教学,比较适合学生的口味,所以很受学生的欢迎。
那么,受学生欢迎是否是评价教学水平的根本标准呢?要探讨这个问题,必须涉及另一个更为根本问题,即教学的目的是为了知识传授还是为了学生的发展?因为这两者并不完全统一。知识传授是指最新知识的传授,而不是固定知识的传授,这是大学教学和中小学教学的根本差异所在。可以说,对教学水平进行高低评价是很难的,我们不能运用一些简单化的方式来进行评价,必须考虑影响教学效果的多重因素。
二、现有教学水平评价方法的局限性
从现有的高校教学水平评价方法看,其局限性是相当明显的,其准确性受到各种因素的影响,所起作用较为有限。高校一般采用教师授课、学生打分为主。学校制定评价标准,确定分值,学生根据评估标准进行打分,最后累加总分加以平均。这种评估形式最大的弊病就是随意性较大,对教师和学生双方缺乏必要的约束,有时会造成师生之间的矛盾对立。
从学生方面说,对自己较为喜欢的教师,打分一般较高,而不甚喜欢的教师打分相对较低。为了获得较高的分数,教师只要平时注意和学生接近即可达到目的。据笔者近几年来对福建师范大学的调查发现,学生对教学水平评价的重视程度呈逐年递减的态势。一年级的学生最为认真,82%的学生都能根据评估表格标准认真打分,评价结果基本真实可靠;二年级学生态度次之,仍有61%的学生认真打分;三年级学生中,认真打分的学生只占30%,有30%的学生是胡乱打分,40%学生持无所谓态度;四年级学生打分最不认真,认真给教师打分的同学不到20%,50%的学生是胡乱打分,余下的同学则干脆弃权。学校对不认真打分的学生是没有办法加以约束的。
从教师方面说,假如某教师因学生评估得分较低而受到某种程度的惩处,该教师就可能在期末考试时加大试题难度作为回应。这也是学校没有办法加以约束的。这种情况虽是少数,但其负面影响却很大。由于评分过程受诸多因素影响,评估的分数本身难以反映教师教学的真实水平,有时候,得分高的教师不一定比得分低的教师强。
三、改革教师教学水平评价的设想
在绩效评价方法体系中,有一种方法叫行为评价法。该评价法是假定相应的行为理论研究带来相应的绩效,通过对被评价者表现出来的行为来进行绩效评价。行为评价法引申到教师的教学水平评价中,就是通过教师在教学过程中表现出的行为来进行教学水平评价。
在教师的教学过程中,教师的行为分为有效行为和无效行为。有效的教学行为是能对学生起作用并带来实际学习效果的行为;无效的教学行为不能对学生起作用或起相反的作用,不能带来实际学习效果的行为。在既定的教学环境下,教师在教学过程中表现出有效的教学行为,主要受到教师的能力、努力和角色(任务)认知的影响。在很大程度上,能力是由教师个人的特征和所拥有的知识与技能决定的;努力是指个人在完成任务时所运用体力上或心理上的力量;角色(任务)认识是指个人认为在工作中应努力的方向,或者说是教师对完成教学工作所必需的活动和行为认识。因此,通过行为评价法确定教师在教学工作过程中的有效行为,能在一定程度上反映教师的个人特征,更能直接体现教师的教学在学生身上所产生的效果。因此,对教师教学水平的评价,行为评价法具有较高的适应程度,适合作为主要的评价方法。
近年,为了促进教学质量的不断提高,很多高校制定了教师教学质量评价制度,并且将教师教学效果与职称评聘、年终考核直接挂钩。不少高校为了使教学质量评价工作更加规范、科学,建立和实施了以量化指标为基础的教学质量评价办法。
一、高校教师教学质量评价量化考核的情况
当前,高校普遍建立了以学校教学督导委员会直接领导下的教学质量评价中心为主体的组织机构,具体负责全校教师的教学质量评价。
多数高校已形成以学生评价为核心、专家评教和同行评价相结合的教师教学质量评价体系。学生评教主要是授课班学生网上评教,学生评教由学校教务处统一组织,各院系协助实施,每学期期末所有学生在规定的时间参加网上评教。教师网上评教成绩主要是学生对授课教师的教学态度、教学内容、教学方法、教学效果等方面进行打分并做权重处理后得出。专家评教指学校教学督导委员会和学校教学工作检查组专家(一般是具有副高以上职称的经验丰富教师)根据每学期的听课和教学工作检查情况对教师教学质量进行评价。同行评教主要由各教学单位(院系)具体组织实施,每学期组织相近专业的教师采用听课、观摩的方式进行评教或互评,达到相互交流、取长补短、共同提高的目的。专家和同行分别从教师素养、教学内容、教学方法和教学效果等方面对授课教师进行评分经权重处理后得到专家评教和同行评教成绩。
期末或年末根据三项分值经过加权计算每位教师教学质量综合成绩,并根据预先设定的标准确定相应等级。
y=αx1+βx2+γx3
其中,y是教学质量综合评分,x1是学生评分,x2是专家评分,x3是同行评分。α、β、γ分别是本学年学生评教、专家评教、同行评教三部分成绩各占总成绩的比重,α、β、γ是学校根据三部分的重要性和客观性的判断来统一决定的,α+β+γ=1。
如果本学年学生评教、专家评教、同行评教三部分成绩缺一项,则另两项权重相应调整。如本学年某位授课教师没有专家评教成绩,但有学生评教和同行评教成绩,则两者所占总成绩的比重分别是α、γ,α+γ=1。某位教师的综合教学评价成绩:y=αx1+γx3。
教学质量评价中心每学年根据教学质量综合评分的高低以院系为单位对教师进行排名,按优秀、良好、合格、不合格确定每位教师教学质量评价等级,评价结果以学校文件的形式予以公布。
学校统一建立教师教学质量评价档案,把教学质量评价结果作为教师考核、教学评奖和职称晋级的重要依据。对教学质量评价不合格的教师,由院(系、部、中心)负责协助教师本人制定改进措施并督促执行,学校教学督导委员会、教学质量评价中心和教务处负责跟踪检查该教师教学工作的改进情况。
二、对教师教学质量评价方法的评价
高校教师教学质量评价方法采用量化的办法,从学生评教、专家评教和同行评教三个方面对教师的教学质量和水平进行评价,使高校教师教学质量评价工作更加规范、科学,完善了高校教学质量评价体系,是高校制度建设的重要组成部分。教师教学质量评价体系提高了教师教学质量责任意识,引导教师不断进行教学内容、教学方法、教学手段改革,形成多样化的教学风格,从而促进教学质量的不断提高,也为教师职称评定提供教学效果评价依据,为评选教师课堂教学优秀奖提供参考。
但我们应清醒地认识到,要客观、准确、公平地评价课堂教学质量绝非易事。我们在实践中发现有一些客观因素影响着评价结果的准确性。
1.学生参与评教的人数影响评教结果的公正性。同一位教师的同一节课,听课学生会有不同的评价,甚至得出完全相反的评价。一般来说,学生参与评教的人数越多,综合评价越客观、公正。
2.课程本
身的有趣程度影响学生评价结果。一些课程本身比较有趣或者学生普遍感兴趣,教师所讲内容更容易引起关注,对教师的评价也会高一些。
3.开设新课的教师与一直上同一门课的教师教学效果存在差距。毕竟教学资料和教学经验是需要长期积累的,上新旧课的熟悉程度不同,教学效果也存在差异。
4.一些教师一学期开设几门课,教学任务量很大。不是每门课都能讲得好,因为每个教师都有各自的研究方向。另外,上课太多、太杂导致每门课的准备都不充分,势必影响到综合评价结果。
5.高年级学生可能对教师的要求更高一些。根据调查分析,一年级学生对教师的满意度最高,二年级学生其次,三、四年级学生对教师的满意度逐渐下降。其中的原因是随着学生专业知识的增长,后期课程的新鲜度下降。
6.能说会道或人际关系好的教师可能无形中提高了学生的评分,严格要求学生可能影响部分学生对授课教师的评价分值。
为了弥补学生评教的不足,一些高校增加了专家评教和同行评教。这两种评教方法有相似之处,都是教师对教师的评价。
但这种方式存在两个问题:一是督导组成员有限,每学期(学年)对全校教师全覆盖听课,工作量过大,组织困难。二是督导组专家的评价打分尺度存在差异影响到授课教师之间教学质量的客观比较。因此,听同一教师课的专家过少,会影响到教师教学质量评价成绩公正性;听一节课的专家越多,平均分值的客观性越强。
同行评教设计的初衷是同行听课更有利于从专业角度对授课教师的教学内容进行评价,但由于同行往往是同一院系的相同专业教师,彼此熟悉,存在利害关系,或碍于情面,会普遍打高分,失去客观公正性,甚至导致同行评教流于形式。另外,同行评教也存在着同行教师参与同行评教的积极性普遍不高的问题。
三、教学质量过程控制比结果控制更重要
高校的首要职能是人才培养,提高教学质量无论对学校和教师个人都是头等大事。完善教师教学质量评价工作,确保对教师教学质量进行全面、科学、客观、公正地评价,对调动教师的教学积极性,有效促进教师不断提高教学水平和教学质量具有重要意义。
近年,高校教师的教学水平整体上在逐渐提高,无论是在教学内容方面,还是在教学手段和方法方面都有了很大进步,但教师教学水平的提高与学生日益增长的对教师教学水平的要求之间仍存在一定的差距。
如何根据学生时代特点、培养目标差异、学生志趣、认知水平、学习能力的不同等具体情况组织教学是教师持续面临的挑战。
中图分类号:G521 文献标志码:A 文章编号:1673-291X(2012)09-0281-02
一、对教师教育结果评价的传统标准
考试制度在中国的历史发展进程中具有重要的地位。早在商周时期,科举取士制度就开始萌芽,直至隋唐时期发展成熟[1]。虽然这一制度随着清王朝的终结而被废止,然而它对全世界的影响直至今天也是根深蒂固的。现代考试制度仍然把普通全日制学校学生理论知识学习的结果作为评价教师教育结果的唯一评价标准。并把教育测验作为评价教育质量的唯一客观方式。传统的教育测验相对于当时的社会发展基本状况有着理论与实践两方面的长足进步。
1.目前教育评价方式的理论假设。在科举制度产生之前,国家的用人制度大多采用举荐、推选和世袭等方式。这些方式在最初人类社会生活组织形式较为简单的氏族社会和贵族社会,是能够适应管理社会生活的要求的。然而随着社会分工的日益细密,人类社会生活的复杂化,这些简单的人才选拔方式由于其主观性已不能满足社会发展的要求。“还会有什么事能比选择一位王后的长子来治理国家更加没有道理呢?我们是不会选择一个出身于最高门第的旅客来管理一艘船的。” [2]同样,人们有时出于私利,并非总能够选出或者推举最合适的人选来管理大家的日常事务。出于这样的原因,人们采用了测验这样的方式,尽可能的保证选拔人才的客观性。这相当于制定了一个对于所有人来说机会均等的选拔制度。毕竟,其一,这种方式理论上使所有具有潜力的人都有参与的可能性,其二,可以对参与者的学识根据其作品做出相对客观的评价,而非进对其表面言谈举止做出片面的判断。其三,这种选拔方式有利于教育朝向有目的、系统化的方向发展,使社会培养人才的方式和效率得到改良。
2.教育测验,可具体操作的人才选拔方式。相对于推选、举荐和世袭的用人制度,教育测验在实践操作中也具有规则执行和过程监控方面较为简便的优势。世袭的方式暂且不论,推选和举荐在具体操作时比较费时费力,其结果也具有较大的主观性。庄子说:世俗之人,皆喜人之同乎己而恶人之异乎己也[3]。这个说法符合人们日常生活的一般经验。从这个一般经验出发推论,让公众推选出大多数人都认可的优秀的人才一般只具有理论上的可能性。因为公众的客观性从一般意义上说从某种程度上总大于个体的客观性,这个一般经验同样适用于举荐的情形。从这个一般经验还可以进一步推断,每一个体主观性的相加将有可能大于任意个体的主观性,而所有个体的客观性之和也并不会大于任意个体的客观性。因为客观性并不会产生于从个体私利出发的不同意见的争论,而更有可能产生于少数个体的智慧。然而,人们却可以商定它们所处社会优秀人才所具有的品质,并把此作为选拔人才的一般标准。然后,人们可以从这些一般标准出发,据此制定教育测验所应包含的基本结构。
二、传统教育测验评价标准的局限性
1.测验结果的偶然性。传统的教育测验往往把一次考试的分数作为教师某一阶段教学结果的评价标准。虽然这种方式比教育管理部门的主管随意判断具有客观性,但这种客观性所具有的公平与公正是具有偶然性的。首先,一次考试的结果的准确性总是会遭到种种质疑,除非这次考试试题的设计具有理论上的完美;接受考试的学生处于相同的外部环境;并且都充分的展现出了真实的学习水平;对考试结果进行评判的教师也具有理论上的严谨;如此等等。其次,在同一受教育阶段,例如小学阶段,每次测验的内容以及难易程度只具有理论上的一致性。尽管教学大纲规定了每一学习阶段应掌握的内容,并描述了对这些内容应考察的难易程度,如果试题的设计者没有对每一次考试做出整体规划的意识,就不能保证多次考试结果的一致性。
2.对测验结果解释的随意性。当前,各种教育测验的结果仍然是原始分数。如上所述,每一次考试的原始分数具有偶然性,不仅如此,人们在解释这一测验结果时,往往把量的差异当做是质的差异,并以此作为奖惩的依据。微小的量的差异是具有偶然性的。这种偶然性的差异并不具有实质性意义。传统的排列顺序的比较方法无法把量的差异与质的差异区分开来。相对而言,应用统计学为分辨这种差异提供了一个有效途径。但目前尚未见到使用统计工具对考试分数做系统地分析。而用排列顺序的简单方法,把微小的分数差异作为评价教师某一阶段教学结果评价的标准,这一做法貌似公平,实则由于评判标准的粗燥却是不甚合理的。然而更重要的是,相对于社会对人才的具体要求而言,测验的结果在理论上被夸大了。目前,随着课程改革在理论与实践层面的不断深入,测验的内容和形式和学生的实际生活联系越来越紧密。但由于绝大多数基础教育阶段的教师对课程改革目标理解的程度不够深刻,在设计测验时不能把新的课程目标体现具体的考核内容之中,测验结果也因此仍然是传统意义上的对基本知识和理论的复述和基本运用。对学生的能力提高和情感、态度与价值观的获得与发展的评价并没有体现在测验内容和形式之中。课程改革目标体现了教育政策制定者针对具体的社会发展对教育实践的基本要求。如果当前的教育测验不能与这个课程目标有效结合,那对测验的结果的解释就会被夸大。
3.测验内容取样的代表性。因此,在设计测验内容与形式时,就必须从新的课程教育目标出发,有针对性的提高试题取样的代表性。首先,应在设计测验结构时事先划分好考核代表三个范畴的课程目标的试题的比例。应具有把能力与情感、态度价值观作为考核内容的意识,然后再根据具体教学内容制定测验的基本框架。其次,结合社会对学生在未来生活中要求,编制试题的具体内容。譬如初中阶段的数学教育重在培养符号转换与运算的逻辑思维能力、思维的条理性、热爱理性的情感以及对客观事物严谨的、审慎的态度。那么,在设计测验时,就可以体现在试题的具体内容之中。最后,试题的形式要结合学生的实际生活,灵活、多样。任何知识与基本理论都来自于人们对生活经验的概括和总结,因此,它也可以被还原为生活中的具体问题,而只有还原为生活经验的知识与理论,才能被学生有效内化为能力、态度与价值观。
三、建立结合社会发展要求的评价系统的理论必要性和实际可能性
1.教育大纲体现社会对人发展的要求。根据社会发展的具体现状,国家调整了教育工作的目标,教育管理部门组织教育领域的理论工作者们根据国家教育改革的政策性文件所规定的目标编制了各教育阶段的新的教学大纲。这一教学大纲实质上是系统性的每一阶段、每一学科课程的较为细致的教学目标。它体现的是国家为使每一个未来的公民能够适应并促进社会发展,在特定的成长阶段应该达到的理想目标。因此,教育质量提高与否,应把在教学活动中学生达到这些目标的程度作为唯一的评价标准。然而,对这个评价标准的不同理解,决定了对教师教育结果评价的不同形式和内容。要客观的理解这个目标,如果不从社会发展的宏观历史层面和当前社会生活具体层面出发,这个理解便是晦暗不明的,如果不把这二者结合起来,这个理解便是片面的、武断的。缺乏对这二者联系起来的系统考量,就不能把这个目标体系落实到具体的评价措施中去。首先,相对改革初期而言,在社会变革的新时期由于经济的快速发展所带来的社会的阶层的暂时分化成为影响社会稳定的首要因素。与此同时,随着对外开放而涌入的新的价值观念与传统价值观念的冲突与融合正在进行之中。因此,积极情感、态度和价值观的培养就成了现在和未来一段时期教育工作最紧迫的任务。其次,中国正处于社会生产由劳动密集型向技术密集型转变的关键时期,科学技术创新是国家经济发展的首要推动力。因此除对掌握基本理论知识的要求而外,创新能力的培养也是当前教育工作的核心任务。现在所需要的,是建立一个结合社会发展要求的评价系统。
2.教育评价与教育大纲结合的有效性。理论上的必要性与紧迫性并不意味着现实的可能性。在现实与预期目标之间总要付出一定的努力。预期目标越是远大,需要付出的劳动越是艰辛,也越是需要较长的时间。其中主要的影响因素包括以下两个方面。其一,由于中国的教育管理体制的原因,各种教育改革活动总是自上而下进行的,因此,各级、各类教育机构管理部门观念的更新是转变传统教育评价方式的关键因素,尤其是在基础教育阶段,这一转变需要更长的时间。引起行为改变的原因一者在于外界环境偶然因素的刺激,一者在于一以贯之的教育与宣传。如果偶然因素所产生的刺激不足以引起质的变化,其所诱发的行为改变也会是暂时的,表面的。而持续的目的明确的教育与宣传,却能使量的变化逐渐累积为止的变化。后者的作用显然要强于前者,不过后者所要付出的劳动时间和程度也会多于前者。其二,教师教育与新课程目标的紧密结合是实现新评价方式的基础。评价方式的改变只是促进教育质量提高的外部因素,它能够起到引导教育工作一线的教师教学目的与方法的改变。不过教师劳动的结果如何,最终取决于其自身的专业素养。譬如如何领会各种国家教育政策、教育方针所指向的社会现实需求;如何灵活的运用所学的教育学与心理学知识与理论,把握学生在认知、情绪、自我意识、态度与价值观各领域发展的实际水平,灵活运用教学方法与规律,有效促进学生的实质性发展;如何与同行和教育理论工作者开展合作性研究,解决在教学实践工作中碰到的具有挑战性的实际问题,提高自身业务水平,从而提高教育质量。最后,应明确教育评价的目的主要在于诊断学生 在某一学习阶段各方面实际发展的具体情形,有助于教师与学生及时发现问题,查漏补缺,长善救失,对教师劳动结果的衡量以及在此基础上的奖励与惩罚到是一个次要目的了。
参考文献:
如何抓住实施素质教育的关键。科学合理地进行教师评价,促进中小学教师发展,是我们每个教育工作者必须认真研究的课题。
一、教师等级考核评价
所谓“等级”考核,是指教师考评标准区分为若干等级,每个等级都有不同的考评标准,考评时根据客观事实,对照考评标准,作出较客观的价值判断。
1.考评操作时,采取分层考核,自下而上、上下结合的考评方法,在教师自评的基础上,先由组长(年级组长、教研组长)考核教职工,由主任(教导主任、总务主任)考核组长,由校长办公室考核主任。而主任、校长等也要经过民主评议。评议的过程中也允许教师有申诉、阐述的权利。
2.考核标准由学校领导广泛听取教职工意见后制定,考评方案经教代会审议通过才能执行。这个讨论的过程使教师对评价标准心中有数,使教师考评有主动性。
3.对教师节评价不能一锤定音,它应该是动态的,一定时段内的多次评价,有利于避免片面性。但过密的考评也是不利教师的,无论在精力和时效上都是不可取的。因此,采取月考的时差是比较适当的。每月考核评定一次,主要考核教师节的职业道德表现、教育教学工作情况等。
二、班组等级考核评价
班组指班级及年级组、教研组、备课组等。班组等级考核是指对班级、年级组、教研组(备课组)及工会组进行考核考评等。类别相同或相近的考评,可以评出先进和落后,有利于教师的比学互帮。
中图分类号:G427 文献标识码:A
文章编号:1992-7711(2012)16-010-1
体育教学评价是教学过程中必不可少的一个重要环节,它对于教学目标的稳步实现,学生学习过程中正解的行为表现具有积极的引领和导护作用。一直以来,在教学实践中教师的主体作用与学生的主体作用是一个互为主体的互动与切换过程,在这个过程中双主体的作用如何体现,在什么情况下保持良好的互动性,这是一线老师们面临的现实问题,也是值得认真思考的问题,忽视和过份地强调某一方面都可能影响到预计的教学效果。
我们知道,教学评价作为教学过程中的一种方法手段,在不同的教学内容、不同的教育目标、不同的学习条件和不同的学生对象面前,会有着不同的评价类型和评价定位。本文所说的教学评价是指学生在日常的体育学习过程中教师对学生学习行为所作的随机的、即时的指导性评价。
从初中体育教学特别是农村学校学生的实际来看,发挥教师的评价主体作用对于促进学生学习,公正准确地反映各个体学习情况具有真实而积极的意义。运用表扬法、反馈法、引导法是充分发挥教师评价主体作用的有效方法。
一、表扬法
表扬法是教师最常用,也是最为积极有效的方法之一。表扬法是通过教师富有激励性的语言描述和生动的肢体语言表达,及时地记录和传达学生在学习过程中的良好表现的一种方法。教师对学生给予及时的表扬即正面评价是对学生最起码的尊重,这种尊重会在学生的心中留下印记,并产生反应,转化为越加积极的行动。
在应用表扬法的教学实践中,需要特别指出的是:教师面对全体学生的共同学习场景,不能只注意体育学习能力强的学生,而要特别关注体育学习能力不太强的学生,从发展的角度去看待这部分学生的学习状况,用表扬的方法及时地对他们课堂学习的表现给予正面的描述和表达,对于课堂目标的全面达成,对于营造共同的学习情境,实现共同进步是不容忽视的。这一点在我们不少的教学实践课上往往被疏忽。教师更多地也许是更习惯于对教学现场当时体育表现力的关注,认为唯有通过现场对良好学习状态的即时表现给予表扬才是有益的,才算得上是一节好课。事实上,如果教师仅仅对体育表现力良好学生的表扬,而对体育表现力不够但体育学习态度包括认真的观察,积极的体验,热心的互助等表现良好的学生不给予及时的肯定,那就会削弱和挫伤这些学生的学习积极性,久而久之他们就有可能不再喜欢你的体育课。
二、反馈法
反馈法既是最有效,又是最及时的反映学习过程和学习前景的方法之一。反馈法是教师通过具体的反馈途径和手段,向学生传达学习过程的阶段性情况,以及下一步需要改进与提高的建议。
它与表扬法最大的不同是老师的观察不是获得反馈的唯一途径和手段,它需要建立有效的通道,获取信息和传达信息。对中学体育教学而言,除了教师在教学实践中加强对学生学习过程中的各种表现的观察外,鉴于体育教学的特殊性和人数与人的运动性,仅凭教师的观察显然不可能及时全面地掌握当时的实际情况,因此,通过学生间的相互观察,设计相互点评和帮助,通过发挥各个学习小组和小骨干的作用,一方面弥补教师观察的不足,另一方面及时提示和提供来自不同方向的学习情况的信息,使教师对教学进程和教学效果能够及时掌握,使学生能随时了解和知晓自己学习的状况、学习的进程以及正确与否。
需要提出的是这里的学生间的相互观察是为教师对学生整体的学习评价提供帮助,因此,学生的观察内容、方法、频数等等都是以教师教学前的设计要求为依据而进行的,不是学生放任的随性的观察。只有这样学生的观察结果才有实际的价值,对教师接下来的评价才有帮助。
三、引导法
引导法是教师通过适当的提示或设计,引导学生、学生家长甚至班主任老师,对某一个或某几个学生体育学习情况进行调控与评价的方法。
体育学习的引导光靠语言是不行的,还必须有具体的可以操作的行为程序设计。
这里的行为程序设计包括:身体练习的诱导、技术学习的诱导、一组练习的程序规定、学习时的行为表现、个体学习时的他人帮助或互动等,通过这些目标指向明确而具体的辅助方法即学习性应用,不但能使个体学生的学习取得良好的效果,而且有时能够激发全体参与者的学习热情,促进整个体育教育教学过程的良性循环。
引导法作为教师对学生学习评价的一种方法,显然它始终而且紧密地存在于教学过程之中,通过行为程序可以使教师在教学过程中很好地依据行为程序的设定及时判定和导引学生的学习行为并给予恰当的评价,可见引导法在这个过程中起到并发挥着教与评并举的双重作用。
(一)评价语言过于机械
现阶段,教师的评价语比较机械,缺乏灵活性,这种评价方式起不到互动的效果。在进行教学的过程中,老师并没有为师生之间的语言交流创造出相契合的情景,在对学生的回答进行评价时,也没有起到比较好的示范作用,学生无法找到与老师进行互动的契机,在语言输入方面存在一定的障碍。并且一些教师的评价语言显得非常的机械,并不恰当。如果教师只是机械的进行重复评价语,这一作用自然也就无法得到有效的发挥。
(二)评价过程形式化问题较为严重
教师在进行评价时,过于形式化,对于教学的过程产生了非常大的影响。很多时候,教师进行评价的动机就是为了完成教学任务。根据已经设定好的教学方法,在学生还没有回答完之前,教师可能已经评价完毕。虽然老师的处罚点通常都是为学生考虑,希望利用评价机制来调动学生的积极性。但取得的效果往往不尽如人意,反而影响了原来的教学进程,而且在教学过程中渗透的评价方法,也比较生硬,无法发挥出应有的作用。
(三)评价形式过于单一
?u价形式的单一化,也使得一些老师的评价脱离了实际的课堂教学的内容。并且过于单一化的评价方法并不符合小学生实际的特点。在评价时过于注重评价的结果,使得教师对于学生的评价过于简单。在很多英语课堂上,教师的评价也没有考虑到实际的内容,也没有在教学的过程中较好的融入教学方法,也就无法起到引导学生关注英语课堂教学内容的效果。
二、小学英语课堂中教师评价的有效方法的探讨
(一)为常用评价语提供语言输入
在小学英语课堂中,教师评价语主要包括教师对学生进行评价,比如发放奖品时,所采用的表达方式,这在英语课堂上占据了很大的一部分。为老师在课堂上常用的评价语提供适当的语言输入,能够加深学生对老师评价的理解。评价语本身应当尽可能的自然真实和简练,并且易懂,使学生在这种情况下能够获得互动语的输入。对老师来说,需要为学生提供较为完整的语言支架,并创造较为合理的语言情景,在对学生进行鼓励时,可以采用一些学生正在学习的句式,学生在此过程中不仅能够获得语境,还能够熟悉句型。长此以往,学生也必然能够学会如何对教师的评价进行反馈。
(二)利用评价物来衔接教学环节
在小学英语课堂中,评价物通常都是教师对学生进行评价时所采用的一些简单的物件,比如卡片和一些手工制品等。对于教师来说,其使用或者制作的评价物要尽可能的结合课堂教学的内容以及教学的过程等,促使老师在对学生进行评价的过程中,能够强化学生对学习内容的理解,尽可能的发挥评价物在评价体系中的作用。当学生在课堂学习过程中处于比较疲惫的状态时,老师可以通过一些游戏,在游戏中给予学生一定的奖励,来激起学生学习的热情和兴趣。在开展不同的教学活动时,老师要合理的使用评价物,以此来衔接前后两个不同的教学活动。在这种情况下,不仅能够对学生进行有效的评价,还能够确保教学活动的顺利进行,同时还能起到其他方面的作用。
(三)恰当的使用评价图引导学生进行语言练习
大学教师课堂教学能力评价是提高教学质量的重要手段,但这种评价不可避免地带有很强的主观性。面对相同的评价指标,不同评价主体对评价指标的理解和使用往往是不一致的,同一个评价主体对不同课程的评分标准的把握可能也不一致。有的评价者明显要求严格,评分普遍偏低,有的评价者正好相反;有的课程难度相对大,有的课程难度相对比较小。如果教师①讲授的课程难度比较大,又遇到了要求比较严格的评价者,该教师的评分会显著偏低;相反,如果教师讲授的课程难度比较小,评价者的要求比较宽松,该教师很容易得到比较高的评分。现有的评价体系用原始分直接相互比较并按固定的分数段划分等级,评分过高和过低导致评分的区分度不够,评价主体对评价标准的理解和把握不一致导致“苦乐不均”,这种现状严重影响了教师提高教学质量的积极性,必须引起足够的重视。
研究者试图通过构建大学课堂教学质量评价指标体系来解决大学教师课堂教学能力评价的问题,并进行了积极的探索。[1][2][3]目前,相关研究主要集中在评价指标的选择和定义、权重设计和评价活动过程管理方面[4][5][6],对评价数据的应用问题关注不够,特别是对评价分数的主观性问题和分数的相对高低问题未引起足够的重视[7][8]。要对大学教师的课堂教学能力进行更为准确的评价,我们必须尽量剔除评价分数中不合理的主观性因素,并合理划分评价等级。
多面Rasch模型为剔除主观性因素提供了可行的方法,却不能解决评分等级划分的问题。该方法在人才测评、英语口试等主观评价中得到了广泛的应用[9][10],在大学课堂教学质量评价中则应用非常少。本文将多面Rasch模型引入大学课堂教学质量评价数据应用之中,用于剔除评价分数的主观性因素,并补充聚类分析法重新划分等级,从而为大学教师教学能力评价提供新思路。
一、研究设计
(一)研究方法
多面Rasch模型将被评价者得到的分数分解为被评价者的能力估计值、评委宽严度、项目难度以及等级难度等因素。被评价者的能力估计值独立于评委的特点以及特定项目的难度,而在大学课堂教学质量评价中,同一个评委往往在不同的时间对多门课程教师的教学情况进行评价,不同课程难度不同,评委对评价指标的理解和把握存在差异,剔除这些因素才能对大学课堂教学质量作出准确的评价。利用Facets3.63.0对数据进行处理,得到被评价者的能力估计值,再利用聚类分析法将能力估计值划分为不同的等级。
(二)样本与数据来源
本次研究从某高校的一个学院抽取了2014年5月至6月的105份课堂教学评价表。其中,听课人共6位,被听课的教师共23位。按照听课人将23位教师的课堂教学评价表进行分类,18位教师分别被4位相同的听课人评分,其他5位教师被若干不同的听课人评分。听课人的编号为A、B、C、D,教师的编号为1、2、3…18。将18位教师的课堂教学评价表抽取出来,每位听课人给每位教师的评分按照同一听课人的平均分计算。例如,编号为1的教师被编号为A的听课人评分两次,编号为A的听课人对该教师的评分按照两次评分的平均值计算,被听课人最后的分数等于4位听课人评分的均值。经过整理,我们得到了4位听课人对18位教师的评分数据共72个,形成本次研究的样本。
(三)描述统计
听课的基本情况为:听课人共4名,其中3名男性和1名女性;被听课人共18名教师,其中10名女性和8名男性。
每位听课人对教师的评分情况见表1。编号为A的听课人打出的最高分为95分,最低分为81分,平均分为86.3,高于平均分的人数为8人,低于平均分的人数为10人;编号为B的听课人打出的最高分为91.5分,最低分为84分,平均分为87.8,高于平均分的人数为9人,低于平均分的人数为9人;编号为C的听课人打出的最高分为94分,最低分为80分,平均分为88.2,高于平均分的人数为8人,低于平均分的人数为10人;编号为D的听课人打出的最高分为93.5分,最低分为83分,平均分为89.1,高于平均分的人数为9人,低于平均分的人数为9人。从评分分布情况来看,A与C的评分比较接近,B与D的评分比较接近。
二、实证分析
教师的原始分数取决于自身的能力、听课人对评分标准的理解和把握程度。我们无法直接评价教师自身的能力,所以将教师的原始分数分解为被评价者的能力估计值、评委宽严度、项目难度以及等级难度等因素,从而得到教师能力估计值。
(一)听课人对评分的影响
1.听课人的宽严度
宽严度用于描述听课人对评分标准的理解和把握的一致性程度,结果见表2。听课人A的宽严度为0.28 logits,是最严格的听课人。听课人D的宽严度为-0.27 logits,是最宽松的听课人。分隔系数为2.94,信度为0.9,听课人宽严度卡方检验x2(4)=28.8,说明听课人之间的宽严度存在显著差异。
宽严度的Infit值表示听课人打分与听课人自身宽严度相符的程度。听课人很难按照一个恒定的宽严度打分,多面Rasch模型允许Infit值在0.5到1.5之间波动[11],大多数研究设定为0.8到1.2之间[12]。听课人的Infit值在0.81到1.08之间,说明听课人自身对评分标准的理解和把握是比较一致的,没有出现对同一个人打分前后宽严度不一致和对不同的教师打分宽严度不一致的现象。
所以,本研究中宽严度不一致来源于不同听课人对评分标准的理解和把握不一致,而不是听课人打分与自身宽严度不符超过了一定范围。自身能力差的教师遇到了打分宽松的听课人,相对打分严格的听课人,分数有提高的可能性;自身能力强的教师遇到了打分严格的听课人,相对打分宽松的听课人,分数普遍要低。但是,本次研究的4位听课人是相同的,并且4位听课人的打分与自身宽严度是相符的,不同听课人之间的宽严度差异不影响对教师自身能力估计的准确性,但影响原始分数的大小排序,导致按照原始分数评价教师自身能力的准确度不够。
2.听课人对项目难度的把握程度
项目难度用于说明听课人在哪个测评维度上把握严厉(数值大),哪个测评维度上把握宽松(数值小),估计结果见表3。根据该校的课堂评分表,题项2为“讲授思路清晰,重点突出”,该项评分标准把握最为宽松;其次为题项8“理论联系实际,注重实际能力培养”,说明教师在这两个题项上容易得到较高的分数。题项4为“教案准备充分,课堂信息量大”,该项评分维度把握最为严格;其次为题项5“语言表达规范,师生双向交流”,说明教师在这两个题项上很难得到较高的分数。
项目难度的Infit值出现异常,合理的范围为0.5到1.5之间[11],大多数设定为0.8到1.2之间[12]。题项1“为人师表,治学严谨”和题项7“课堂组织严密,教学纪律良好”小于0.5的临界值,题项3“课堂内容充实,讲授内容熟练”处于0.5到0.8之间,说明听课人在这些评分维度上评分过于一致,区分度不高。
听课人对三个评分维度把握不准确,主要表现为三个维度评分过于一致。原因可能有两个:一是因为听课人没有很好地理解和把握评分标准,分数不能体现教师在这项能力上的差异;二是教师在这三个评分维度上表现比较一致。这三个维度都是比较容易观察的,18位教师的教龄都在5年以上,一般都能达到这三项基本要求。
(二)剔除听课人影响后的教师能力估计值与排序
1.教师能力估计值
18名教师能力估计值范围为-0.92到1.05logits之间,全距为1.97logits。其中,编号为5的教师能力估计值最高,为1.05logits(S.E=0.17);编号为12和9的教师能力估计值最低,为-0.92logits(S.E=0.16);编号为16和17、编号为15和3的教师能力估计值是相同的,分别为0.11 logits和-0.99logits。分隔系数为2.89,说明评分整体是有效的。分隔信度为0.89,说明教师能力存在较大差异。 x2 (18)=157.2,p=0.0
Infit值用于说明听课人评分的一致性程度,是用模型预期值和观测值之间的差异进行描述的统计量。Infit值可接受范围在0.5到1.5之间,具体取值视测评精度需要而定。如果测评精度要求比较高,可以考虑将Infit值设置在0.8到1.2之间。编号为4的教师的Infit值等于1.66,大于1.5的临界值,说明4位听课人对该教师评分非常不一致;编号为17、3、13、12、9的教师的Infit值为0.5到1.2之间,在可接受范围内,但也存在较大不一致;编号为16、1、15、18、14、10、7和2的教师的Infit值都小于0.8,说明4位听课人对这些教师的评分与模型期望相比过于一致。
2.教师能力估计值排序
将原始分数和教师能力估计值分别排序,1表示最高,2表示次高,依次递减。排序结果(见表4)显示,原始分数排序结果与能力估计值排序结果存在明显差异。编号为4、5、8和16的教师的原始分数排序与能力估计值排序是完全一致的。相比原始分数排序,编号为1、15、17的教师能力估计值排序提高了一个名次,编号为2、3、7、6、9、10、12、13和18的教师能力估计值排序提高了两个名次,编号为14的教师能力估计值排序倒退了两个名次。
(三)等级划分
利用SPSS20.0的聚类分析法对教师能力估计值和原始分数进行分类,根据每个类别的均值大小排序,并划分为若干等级,分析结果见表5。
说明:原始分数等级(a)表示按照固定分数段划分等级:90分及90分以上为优秀,80-89分为良好。原始分数等级(b)表示用聚类分析法将原始分数划分为4个等级,教师能力估计值等级表示用聚类分析法将教师能力估计值划分为4个等级。空格内的数字为划分到不同等级的教师对应的编号。
将不同等级划分方法得到的结果进行比较。按照固定分数段划分等级,教学质量评价分数一般分为优、良、中、及格四个等级,90分及以上为优秀,80-89为良好,70-79为中等,60-69分为及格。编号为4、5、8的教师被划分到优秀等级,其他教师被划分到良好等级。用聚类分析法将原始分数分为四个等级,编号为5的教师被划分到优秀等级,编号为1、3、4、8、15、16、17和18的教师被划分到良好等级,编号为6、10、11、13和14的教师被划分到中等等级,而编号为2、7、9和12的教师被划分到及格等级。用聚类分析法将教师能力估计值分为四个等级,相比原始分数划分等级的方法,编号为18的教师从良好等级下降到中等等级,编号为10的教师从中等等级下降到及格等级,编号为5的教师仍然被划分到优秀等级。
三、研究结论与管理建议
(一)研究结论
基于多面Rasch模型,利用某高校2014年5月至6月4位听课人对18位教师的72个评分数据进行了实证分析。结果发现,不同听课人之间打分的宽严度不一致并对三个评分维度把握不准确。因此,我们应该使用教师能力估计值结合聚类分析法划分等级,从而更加准确地对教师的教学能力进行评价。具体分析如下。
1.教师能力估计值对教师真实能力的估计更加准确
测量理论假设分数越高,能力越强,分数代表真实能力,其隐含的假设前提是不存在评委导致的非系统性误差。教师能力估计值是从原始分数剔除评委宽严度、项目难度以及等级难度等因素影响后的余值。如果听课人之间的宽严度一致,评分与自身宽严度一致,对评分项目的理解和把握一致,那么教师能力估计值等于原始分数。相反,教师能力估计值不等于原始分数。
在本次研究中,听课人的打分与自身宽严度一致、不同听课人之间打分的宽严度不一致的现象不足以造成评委导致的非系统误差,但是听课人对三个评分维度把握不准确导致原始分数对教师真实能力估计不准确,这是非系统性误差。因此,原始分数不足以代表教师的真实能力,教师能力估计值对教师真实能力的估计更加准确。
2.教师能力估计值等级划分比原始分数固定分数段划分的方法更准确
将不同分数划分为若干等级的目的是体现分数的相对高低,从而说明教师能力的相对强弱。按照固定分数段划分等级往往是人为规定的,无法体现分数分布状态对分数高低的影响,我们可以采用聚类分析法来解决这个问题。将教师能力估计值与聚类分析法集合起来,既能剔除听课人对分数的主观影响,也能体现分数的相对高低,从而体现教师真实能力的相对强弱。
(二)管理建议
本研究能为大学教师教学能力评价提供有价值的参考,建议将教师能力估计值结合聚类分析法用于大学教师教学能力评价,具体方法如下。
1.数据分析常态化
高校往往将课堂教学质量评价作为教学管理的日常活动,其数据可以作为评价教师课堂教学能力的数据来源。当课堂教学质量评价活动结束后,管理方应组织相关人员开展数据分析,将原始分数分解为教师能力估计值、评委宽严度、项目难度以及等级难度等因素,将教师能力估计值结合聚类分析法将教师分数划分为若干等级。
2.听课人管理制度化
多面Rasch模型可以用于发现打分异常的听课人。对于自身宽严度不一致、评价项目理解和把握不准确的听课人,要进行提示、培训甚至淘汰,建立对听课人的激励和约束机制,促进听课人认真履行职责。
3.评价项目动态更新
管理方应定期组织相关人员对评价项目开展分析,及时更新评价项目。对于分值很高的评价项目,应该将其总分分解为若干等级,并进行定义和描述,促进评委对评价项目的理解和把握。[13]对于区分度不高的评价项目,可以作为教师基本职业规范的评价项目,而不作为教师教学能力评价的项目。对于相关性比较高的多个评价项目,可以考虑利用因子分析法等统计学方法再次提炼,提高评价项目的科学性与合理性。
注释:
①本文的教师均指大学教师,能力均指课堂教学能力。
参考文献:
[1] 裴娣娜.论我国课堂教学质量评价观的重要转换[J].教育研究,2008(1):17-22.
[2] 喻方元.高校教师课堂教学质量评价体系研究[J].高教发展与评估,2008(3):80-85.
[3]董河鱼.课堂教学质量评价问题及对策[J].内蒙古师范大学学报(教育科学版),2010(3):42-43.
[4]刘伟,孙林.基于支持向量机的课堂教学质量评价[J].合肥工业大学学报(自然科学版),2010(7):968-971.
[5] 谢巍,柏宏斌.模糊评判在高校课堂教学质量评价中的应用研究[J].四川理工学院学报(自然科学版),2006(10):109-111.
[6] 王振友,王振强,陈莉娥.基于层次分析法的课堂教学质量评价[J].广东工业大学学报(社会科学版),2010(6):25-27.
[7] 张克非.课堂教学质量评价数据客观性处理及反馈机制探究[J].教学与管理,2014(3):44-46.
[8] 钱存阳,李丹青.多元统计分析在课堂教学质量评价中的应用[J].数理统计与管理,2005(11):40-43.
[9] 石志亮.多面 Rasch模型分析软件 Facets在英语测试中的应用研究[J].郑州航空工业管理学院学报 (社会科学版),2011(4):143-148.
[10] 孙晓敏,薛刚.多面 Rasch模型在结构化面试中的应用[J].心理学报,2008(9):1030-1037.