教育测量评价论文汇总十篇

时间:2023-02-10 10:11:48

教育测量评价论文

教育测量评价论文篇(1)

教育评估、教育评价是20世纪30年代在美国兴起,60年代兴盛于西方世界并传入我国。这些学科虽然在我国大力已有20余年,但

的进展不大,学科的成熟度不高,与我国广泛开展的教育评价活动很不适应.我国各省市都有院(中心),也成立了许多评估、评价机构,广泛展开了对教育测评估评价活动。而与此相应的教育测验、教育统计、教育测量、教育评估、教育评价理论很不成熟.尤其值得重视的是教育评价与教育研究和发展,以及对教育评价实践的指导.鉴于此,本文对与教育评价相关概念进行简述和辨析.

一.关于教育评价相关概念简述

教育测验:即为考试,它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统,它由主考、

被考(考生)、试卷(试题的集合及其评分标准)、考分四要素组成。考试的过程就是主考组织编制试题,通过试题作用于被考,将正确答案、评分标准与被考的反应(答案)相比较,然后给出考分的过程。考试从宏观上可分为考试和教育考试两大类。教育考试又可分为校内考试和校外考试两类。按考试分数的解释与使用,可分为常模参照性考试和标准参照性考试。按考试对象分,有学业的成就考试、学术能力倾向测验(其目的在于测量考生的潜在能力、发展倾向,如能力倾向测量)、人格测验(如测量态度、兴趣、情绪、性格等).按测验人数分,有个别测验、团体测量.接测验方式分,有纸笔测验(用笔时试卷作答)和非纸笔测验(如口试、实验操作、表演等)。其它可分为难度测验、速度测验、性测验、诊断性测验以及大规模测验(其成绩的使用有权威性,要求严格,标准化程度高)、教师自编测验(即教师自编用于课堂教学的测验)等.[1]

教育统计(学):运用数理统计学的原理和研究教育现象中的数量关系的一门学科。它通过数据的和处理,准确地掌握教育

情况,为制定教育方针、政策提供依据,为开展教育科学研究,探索教育,制定教育方案,检查教育效率提供科学方法,也为教育管理和教育评价提供有效的工具.它分为两大类:一是描述统计学,研究简缩数据和描述这些数据,二是推断统计学,用数据进行统计检验,统计分析和非参数统计法作出决策。前者只是分析某一样本的特点,而后者则是通过抽取母体的一个样本,并以此样本为根据来分析母体的特点.它是在教育的研究中,描述样本,分析样本,分析样本与总体的关系,从而进行教育科学推论的一种原理和方法.其研究方法一般有:大量观察法、统计分组法、综合指标法、统计资料检验法、统计资料图示等。[2]

教育测量(学):研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

手段和数理统计方法等数学工具,根据教育目标或教学计划的要求,研究如何测量和评价教育效果,如何编制测量计划,各种类型试题的优缺点,衡量一个学业成绩测验好坏的数量指标,如何进行测验结果的统计分析,测验分数的解释和评价等.其主要包括:测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验的常模、测验的实施和评分、测验结果的解释等。[3]

教育评估:是一种有系统地去寻找并搜集资料,对评估对象作预测性、估计性的评判,以便协助教育决策者从若干种可行的策略中择一而

行的过程.在我国教育评估与教育评价不作严格区别,在实践中具体运用时,不同的范围和场合有不同的习惯用法.如高等教育中多用评估,在督导部门也称督导评估,而在普通教育领域多用教育评价不过两个概念是有一定区别的.评估有估价的含义,较为模糊粗略,而评价相对而言是较为精确的价值判断,评估多用于群体或单位的状态及效果的估价,而评价则既有对群体和单位的价值判断,也有对个人的判断.教育评估的一个重要目的就是为教育决策提供重要依据,国家教育管理部门要根据教育评估的结果,及时调整教育的决策。教育评估的结果对国家、对学校都是一份咨询材料,而不是行动纲领.[4]

教育评价(学):以教育为对象,研究各类教育目标与相应的教育现象之间的关系,并给予一定的价值判断的学科.它的研究范围可划分

为:宏观教育评价(研究教育思想评价和教育制度评价)和微观教育评价(研究学校教育系统内部各类教育思想和教育活动的评价,如学校办学思想、学校领导管理质量、教师教育和教学质量、学生德智体全面发展质量的评价等)。它的基本范畴是:教育评价的对象,教育评价的范围,教育评价的模式,教育质的规定性评价,教育量的规定性的评价,教育质和量变化的度的评价,教育评价的指标体系,教育评价的类型.其研究的基本原则有:客观性原则、理论联系实际原则、发展性原则和联系性原则.其种类包括目标评价、过程评价、条件评价、贡献评价等.[5]

教育评价(学):教育评论学是研究教育评论现象和教育评论活动规律的科学.或者说它是研究教育评论的、现状,教育评论现象的

本质联系,教育评论工作的性质、任务和作用,以及教育评论工作的原则、方法的科学.教育评论学是与教育理论、教育史并列的一门教育学科.要建立教育评论学的学科体系,必须解决两大难题,即建立教育评论学的范畴体系和概念体系,并给予科学的揭示和阐述,使这些概念和范畴形成一个有机整体.同时,还要运用这些概念、范畴及其所固有的内在联系,采取科学的方法论证教育评论活动中最普通、最一般的科学原理;从而揭示出整个教育评论活动及其形成和发展的基本规律。教育评论学的研究对象和任务,从根本上规定了教育评论学的学科性质和范畴.首先,教育评论活动是一种教育科研活动,它的直接结果是鉴别、评判教育文化的优劣,进而对教育界产生社会舆论导向作用;而教育文化本身及其所产生的依附于受教育者身心的精神产品,都属于意识形态范畴,可见教育评论家属于研究意识形态和揭示教育评论活动的本质规律,建立完整的教育评论学学科体系。所以,教育评论学也属于基础理论学科。再次,教育评论学的研究对象决定了教育评论学涉及整个教育领域,内涵十分丰富。也可从不同视角,针对不同范畴建立多部门、多层次的分支学科(如:教育理论评论学、教育史评论学、教育行政评论学、教育家评论学等),所以教育评论学又是一门综合性的学科[6]

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系:教育测验是对人的知识、技能和能力以及其他某些心理特征的检测,是教育评价的一种手段,确切地说它是

教育评价获得评价信息的工具之一.教育评价获取信息的测验法就是来自于教育测验.

教育评价与教育统计的关系:教育统计是运用数理统计的原理和方法研究教育现象中的数量关系,通过数据的分析和处理确切地掌握教育

情况,也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系:教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

定,为教育评价提供依据,是教育评价信息的主要来源.如果没有教育测量提供的资料,教育评价将成为无源之水,失去了作价值判断的依据,其科学性、准确性便无从谈起。另外,教育测量的结果只有通过教育评价才能获得实际意义,成为改进教育工作有价值的信息.[7]

教育评价与教育评估的关系:教育评价与教育评估是非常相近的两个概念,在许多场合是通用的。评价是精确的价值判断;而评估是估计

的、预测性的价值判断。在我国从政府的文件到学者的文章论著,以及教育实践都把评估与评价混用。我个人倾向于把教育评估的对象限定在以宏观、中观的复杂教育系统的战略性、预测性估价方面,对于微观的较简单的教育系统的过去和现存实态则作为教育评价的对象。

教育评价与教育评论的关系:教育评论是对教育文化的反思和展望,它的对象是以教育文化中的精神文化和制度文化为主的,以真善美作

为评论标准的观念活动。严格讲它与教育评价虽只一字之差,但它与教育评价分属于教育科学的不同领域,有着重大区别。比如,教育评价是一种管理活动,而教育评论则为观念活动;教育评价由评价机构按严密的程序实施,而教育评论则由教育评论家个人采用灵活多样的方式方法评述;教育评价有明确的指标体系并要求量化,而教育评论无需指标体系更不用量化,教育评价的对象是具体的可控的,而教育评论的对象是抽象的,不可控的;教育评价的结果多用于改进工作,而教育评论的结果则多用于改变观念;等等。这不是说教育评价与教育评论一点关系都没有,它们的关系表现在教育评价的结果可以成为教育评论的论据教育评论,而教育评论的结果可以作为教育思想观念影响教育评价所依据的教育价值观。

三、从价值论角度看与评价相关概念的区别

唯物主义的价值论认为,价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

区别。事实判断是以客体的本质和为对象的,它探讨客体“是怎样的“、”是什么“,探讨事物的现象、本质和规律等实体属性,即以理性认识这种抽象思维形式反映客体的本质及其规律。而价值判断是以客体与主体需要的关系为对象,它探讨客体的价值属性,即客体的意义------对社会需要意味着什么,它以多种意识形式-----认识(价值与事实判断)、情感(对价值的态度体验)、意志(对价值的自觉保证)等诸种形式的综合来反映客体与主体需要的关系。

从前面的可以看出,教育评价对评价的对象不仅要借助教育测验、教育统计、教育测量进行量的测定和分析,而且要进行质的分析,

把所有考查绩效的材料和分析综合起来,在多大程度上达到了预期的目的作出价值判断。从这里可以看出,教青评价行为是建立在事实判断基础上的价值判断.教育评价中的事实判断在于诊断与鉴别教育的性状,价值判断则是对诊断鉴别而得的结果或结论,按其价值取向进行合乎目的的推断和判断;事实判断是价值判断的基础,价值判断是事实判断的目的性追求。而教育评论是依据一定的教育价值观和教育价值取向,对教育的一种价值判断。从教育测验到教育评论是一个由事实判断向价值判断的变化过程,我们不能说教育测验丝毫没有价值判断,如在测验什么不测验什么的上是有价值判断的;同样,我们也不能说教育评论就无点滴的事实判断,教育评论需要通过事实判断的真凭实据作论据。

四、对教育评价学及其学科群的建议

教育评价学经过几十年的已初步形成了学科体系,尽管概念、体系有待完善,但已为下一步的研究打下了坚实的基础。与此相应的考

试学(研究教育测验的学科)、教育统计学、教育测量学、教育评估学、教育评论学都已有相应的发展,形成了一个共生的教育评价学科群。21世纪,要使这个学科群得到良好的发展,我认为首先对各个学科的研究范围有个明确的划分,尤其是对教育评价学要有合理的定位,不要再把学、教育统计学、教育测量学的纳入自己的努力范围,要让它们以独立的学科更好地为教育评价学服务。另外,教育评价学还要把属于教育精神文化、制度文化类的抽象的,教育评价无力评价的范围还给教育评论学,让教育评论学更快地发展.同时,要把教育评估与教育评价的关系处理好,可将两者合二为一,形成统一的学科.其次,各学科要明确自己的研究对象,形成概念体系和学科体系,把一些已成熟的概念和约定俗成稳定下来,逐步形成相对稳定的学科知识和概念体系。第三,要处理好理论与实践的关系,加强理论研究,使其适应实践的要求,要积极实践经验并升华为新的理论,丰富和发展教育评价学学科体系.第四,要处理好引进与消化吸收的关系问题。无论是从国外引进的教育评价学理论,还是从教育界以外引人教育的评价理论都要结合我国的教育理论和教育实践,进行修正使其“本土化”和“教育化”。

综上所述,搞清教育评价相关概念的关系,对理清教育评价学科群内各学科的关系,促进该学科群的发展,为丰富和发展教育科学,加快

教育事业的发展有重大的理论和实践意义。

[1][5]见李冀主编·《教育管理辞典》(第二版)·海南出版社·1997年版·第216页、第167页

[2]参见曹延亭编著·《教育统计学基础》·辽宁人民出版社·1984年版·第2--5页

[3]见李冀主编·《教育管理辞典》(第二版)·海南出版社·1997年版·第216页

[4]参见许茂祖编著·《高等教育评估理论与》·铁道出版社·1997年版·第16--27页

教育测量评价论文篇(2)

[中图分类号]G645 [文献标识码]A [文章编号]1005-5843(2013)05-0059-04

[作者简介]李丽菊,红河学院数学学院助理研究员(云南蒙自661100)

一、教师知识结构浅析

教师知识是指教师在处理某个特定事件中的知识整体,是构成教师实践行为的所有知识和洞察力。关于教师知识结构的认识,以舒曼尔(Shulman)为代表的学科取向观点认为,教师为使教学获得成功,需懂得该如何把现已掌握的知识转化为学生可理解或接受的表征形式。它从普通教学法知识出发,关注师生之间的交流,是教师所特有的教学内容和教学法的有机混合体,包括教师有关具体学科的特殊观念和学习难点的知识以及有关该学科的教学方式和教学策略的知识两个重要部分。在这种教师知识的共有特征基础上,舒尔曼将教师知识具体分为学科知识、一般教学法知识、课程知识、学科教学知识、学习者及其特点知识、教育背景知识、教育目标和价值观及其哲学和历史背景的知识等七类。另外,从教师教育视角看,我国师范教育普遍采纳“学科知识、教育科学知识和普通文化知识”三类课程知识模式,其基本的理论预设是“任何具有足够学科知识的人只要懂得普通教育理论和原则,就能够将这些理论和原则自觉运用到具体学科知识点和情境的教学中,提高教学实效”。然而,作为教育教学的行动基础,教师知识显然远远超越这种学术研究领域和教育实践领域的知识分类范畴。从实践教学质量看,如何保障有效性教学的知识应当是教师知识结构的核心构件。

“有效教学”论题是一个历久弥新的问题域,传统的有效教学模式认为,教学的有效性主要表现为:(1)在单位时间内,没有偏离地按照教学设计完成预定的教学方案,采取“课前准备-复习旧知-新授知识-随堂练习-布置作业”的程序化课堂教学模式;(2)在有限的学期内,粗放式地增加教学和学习投入,反复历练得分技能;(3)教学活动被简化为“刺激-反应”的机械模式,其中教师是课堂教学的独白者和教学刺激给予者,学生是教学知识的机械接受者和反应者;(4)考试分数是教育教学有效的质量标准和评价准则,课堂内教得多、学得快、考得好就是有效的教学;(5)学生作为教学产品被塑造的,可以按照同一规格批量生产。显然,这种传统模式是将有效教学简化为教学投入与产出的比率关系,并坚信只要教学效果(产出)满足社会期望,取得好的升学率,那么师生的任何繁杂投入都是值得的。这些运作模式使教师变成了传输知识的工具和工匠,学生成了无头脑的知识储备器。朱文辉针对上述传统线性有效教学模式进行了反思和批驳,指出有效教学的应然追求:课堂教学是在教学行为与教学境遇的各种复杂关系的互动中展开的,教师应该依据学生的学习心理过程来创造各种教育契机,通过主体间交互活动,对课堂中出现的问题、疑难、困惑等生成性资源进行创造性重组,并在资源的生成和利用中推进学生经验的建构和知识的生成;教学的根本使命应是基于具体知识的理解、生成及效用,激发学生学习的内在需要和兴趣,提升他们主动探索的欲望和能力,使知识学习的过程同时成为培养学生主体意识、创新精神和实践能力的过程;知识具有亲历性,教学应自觉弱化知识传递的旁观者逻辑,知识只有内化为学生自身的价值、态度、信念和技能,才能成为衡量学习效果的尺度。

综上所述,就实践价值而言,虽然教师知识分类为教师教育课程设置提供了理论基础,但这些知识的传授和掌握并不等于教学的有效实施。从有效教学的评判标准看,传统的有效教学强调教师完成教学任务,实现教学目标,学生取得好的考试成绩,学校升学率高,这些都达到了便为教学有效。而有效教学的应然追求论强调教学相长,知识共生,成功挖掘学生内在的学习潜力才是有效的,与前者相比其进步之处在于,强调有效教学是师生主体间的互动模态,应促进学生将知识生命化和个性化。二者共同之处均认为,有效教学应是教和学均有效,那么在教学实践中如何才能真正保证教学和学习有效呢?从教师要素看,教师测评知识是保障有效性教学的重要部分,起着教学监测和质量反馈的作用,它是教师职业化和专业化的根本标志,是有效教学的重要保障。

教师测评知识是教师对学校情境中的教育现象及其属性进行计量分析与价值判断中的知识整体。在教育教学活动的设计与实施中,如何科学地测量教育事项,公正地考评教育教学活动结果,以促进学生全面发展,改进教师教学行为,是监控教学过程及其效果评定的主要内容,也是保障有效教学的重要手段。只有使教育教学建立在科学测评程序上,及时诊断出教学实践中存在的差误,才能有效地调整教学策略,改进学习行为,提高教学和学习效率。因此,教师测评知识理应成为教师教育课程设置中的重要组成部分,就教育测评过程及其知识结构而言,教育测量知识与教育评价知识是教师测评知识整体的核心要素,也是教师必备的教育教学技能元素。鉴于此,本文尝试对教师测评知识的内涵进行探讨,期望为我国教师教育的课程设置与教学提供一些参考和启示。

二、教师测评知识解读

(一)教育测量知识

教育测量知识是关于教育现象及其属性进行计量分析和事实判断的知识整体,包括教育测量的基本理论知识和计量统计技术两个主要部分。从操作性定义看,教育测量知识是开展教育教学测量活动所需的一切相关知识,包括测什么的知识、怎么测的知识和如何分析的知识三个方面。从测量行为看,教育测量是根据一定的原理和法则,针对学校教育影响下学生各方面的发展,从量的规定性上予以确定和描述的过程。

教育测量的基本理论知识是开展教育测量的理论基础和行动准则,包括教育测量的基本原理、资料收集、标准制定、质量评定、统计分析、结果运用等知识模块。首先,教育测量的基本原理主要包括测量目标制定、资料收集方法、测量标准构建、数据分析原理、结果解释原则等。其中制定测量目标及其标准的基本准绳是教学目标和学习目标的分解,教师职前教育课程中应通过课程媒介将设置科学的教学目标和学习目标的原理与方法有效地传递给学生。资料收集方法是教育测量的重要环节,教育资料可以大致区分为定性和定量两类,收集不同类型的资料在程序设计、计量测算、保存应用等方面存在较大差别。测量标准是计量分析的理论依据,是教育测量的具体行为准则和计量单元,教育测量总是将某些教育现象或观念化整为零,在具体的、客观的水平上进行分解和描述,使其变得可操作、可计量。数据分析原理是对收集的各种教育资料进行数理统计的技术和方法,以寻找教育现象之间的内在联系和统计联系,为教育评价服务,如测算考试题目的效度、难度、信度、区分度的方法与技术;结果解释原则主要是针对计量分析的结果进行意义解读和教育效果推论,其基本要求是客观而符合事实,不以偏概全。总体而言,教育测量的基本理论知识涉及确定合理参照点、制定科学测量单位、研制有效测量工具三方面的知识,只有这些知识同时具备,测量工作才能顺利开展,进而对教育现象及其属性进行量的规定和描述。

教育计量的技术与方法是教育测量的重要手段,是教师考评学生成绩、评判教学效果的必备工具。从教学过程看,它包括教学目标设定、学习准备状态探测、课程作业设计、学业测验编制和试卷质量分析、学习和教学效果测定等方面的技术和方法。从控制教育测量误差看,测验编制、试卷质量评定、测量数据分析等方面涉及的原理技术和统计方法是教育测量中的重要工具。测验编制属于研制有效测量工具的内容,是测量学生学习效果的重要媒介,编制测验是教师的一项重要教学能力,不可随意应付。好的测验编制应有考核目标、知识内容、分值比例、题型设计、参考答案、评分标准等内容,只有在这些方面作了标准处理,才能保证测验的有效性。试卷质量评定主要是测算试卷的效度、信度、难度、区分度,这些不同的质量指标有其独特的使用条件和计算办法,只有这些指标同时满足了测量学的要求,才能准确测出学生的学习水平。数据统计分析是技术性较强的工作,包括统计分析原理、分值计算方法、软件操作技术、结果分析描述等内容。因此,凡能通过计量分析的教育事项,均需要掌握有关的数据处理技术与方法,只有统计方法使用恰当,才能有效地对各种教育现象及其属性进行测量。

(二)教育评价知识

教育评价知识是指基于教育测量的结果,对各种教育现象及其属性进行价值判断的知识整体。它包括评价的理论基础、组织与实施程序、设计评价方案、结果的分析整合、心理调控技能、统计决断与推论等方面的知识,可以将这些知识概括为教育评价的基本原理和结果评判两大类别。从操作定义看,教育评价是指按照一定的教育目标,对所实施的教育活动的效果及其活动本身进行价值判断的过程,其实质是寻求教育活动的意义与作用。教育评价的理论基础主要是指教育评价中所倚重的指导思想和教育观念,其中国家的教育方针及其相应的教育规划纲要是教育评价的宏观指导思想和行动指南,各种教育教学理论是教育评价的具体行为准则,如王景英和梁红梅(2002)基于后现代主义强调教育评价的方法论中,要倡导反思、批判的思维模式;重新审视定性研究和模糊评判;要倡导多视角、多元化的方法论;要强调评价者与被评价者之间的对话;要淡化鉴定、分等功能,强调评价的研究和促进的功能。又如建构主义知识观的教育评价启示意义在于,强调“评价标准的多元化、评价目标和内容的多维性、评价过程的动态化、评价方法要定性与定量相结合、强调评价的真实性与情境性”。诸如此类论说无疑是教育评价的重要理论依据和方法指南,为此,在教育评价设计中,应在国家教育方针指导下,析取各种教育教学理论的合理因素作为行动依托。

此外,在教育评价活动中,组织与实施是教育评价的准备环节,包括人力、物力、财力和时间计划等方面的准备活动知识。评价方案的设计是教育评价的操作模式,决定着教育评价的质量和功能发挥,主要涉及指标体系构建技术、评价标准分解、确定指标权重方法等知识内容。结果的分析整合是在统计学原理的指导下,借助数学分析技术对测评结果进行计量和分数整合,在总体水平上理解某个分数量值的实际意义,评判教育活动的育人效果,以深入揭示教育结果的价值蕴涵。心理调控技能是关涉评价结果有效传达的知识,该技能的掌握有助于发挥教育评价的导向功能、激励功能和管理功能。统计决断与推论是对教育评价结果的数学分析和统计处理,将评定的教育事实进行意义解读和价值概化,如在教育行动研究或者教育实验中,对某些教育策略或者学习的效果检验及其外在效度判定,它属于教育评价的重要计量技术。总之,教育评价是一项复杂的系统工程,从确定评价的目的、分解既定教育培养目标、设计评价内容及其指标体系、采集和分析评价数据,到解释统计数据事实、利用评价结果等都是教育评价工作不可缺少的环节,完整的教育评价还应该包括反馈和相应的政策调整、教学方法改进措施以及元评价等,这些环节中的相关知识与技能均是教育评价知识的重要组成部分。其中数理计量技术和统计方法是教育测量与教育评价的共同知识成分,它们是目标导向式教育测评的核心知识内容,是教育测评的重要工具。

三、教师测评知识的实践价值

(一)有助于有效掌握学生的学习行为特性

任何教学设计都是以学生的学习准备状态为基础的,当然教育测评并非是掌握学生学习状态及其行为特性的唯一手段,但却是最为科学有效的途径。传统教学设计起始于教师的人生经验和学科知识,是一种“自上而下”式的教学观念和经验的反映,没有考虑学生的学习需求和接受能力,本着“没有教不好的学生,只有教不好的老师”的职业信念实施教学方案,认为传道、授业、解惑就是教师的应然角色,学生就是教学的雕琢品,是知识的容器。为了使教学高效,教师和学生必须在单位时间内完成更多教学任务和学习活动,是一种机械主义的课程教学模式。为扭转这种“高压低效、高分低能”的简单量化教育模式,教师必须具备教育测评的知识和技能。实践表明,有效的教学活动必须以学生的学习心理和行为为基础,而科学合理的教育测评则是了解学生学习心理和学习行为特性的有效手段。

教育测量评价论文篇(3)

中图分类号:G641

文献标识码:A

一、加深对思想政治理论课教学质量测评的认识

《国家中长期教育改革和发展规划纲要(2010-2020年)》(以下简称“《纲要》”)中提出,近十年中我国教育工作有两大任务,分别是“促进公平”与“提高质量”,且认为改革教育质量评价制度与改革人才评价制度,是当前深化改革的重要举措[1]。在贯彻《纲要》时,加强高校思想政治理论课的教学质量测评体系建设具有重要的意义。

笔者认为,加深对高校思想政治理课教学质量测评认识是改革传统教学质量测评体系、增强思想政治教育实效性的重要基础。我们认为高校思想政治理论课教学质量测评是从思想政治教育的使命出发,运用各项教学质量测评指标对理论课的教学活动结果与产生的影响进行评估,将教学成果与绩效划分等级,针对绩效等级提出改进计划,并结合教学效果改进教学活动。如何得到好的理论课教育过程中的投入、产出与成果影响所反映的绩效测评结果,才是思想政治理论课教学质量测评的核心问题所在。

二、思想政治课教学质量测评体系存在的局限性

现阶段,我国教育部提出把思想政治理论课的建设当做考核高校办学质量与教育水平的重要指标,且已将其纳入高等教育的教学评估体系当中。不少学者对测评体系的研究工作已取得一些阶段性的成果,促使其逐渐趋于完善和独立,这使得思想政治理论课教学方面的测评体系逐渐受到各高校的重视。然而,不同地区、不同高校之间缺乏统一的测评目标、原则、方法等指导,局限性突出,整体效果不理想。现从三个方面对其局限性进行分析。

1.测评体系的核心定位不明确

目前,思想政治理论课测评方面存在一个特别突出的问题,即没有将学生学习效果问题置于评价体系的核心,取而代之的是将“所有要素的简单累积”或者“无核心”的评价理念作为其体系,导致无法达到评价的预期效果。现实生活中,学生是整个测评体系的核心利益相关者,他们参与了思想政治教育服务的整个过程和所有环节,通过评价教学效果与教学质量,综合判定教学效率,实现对教育教学课程的有效评估。英国学者麦尔肯・弗雷泽(Malcolm Fraze)认为:“高等教育的质量首先是指学生的学习质量,即学生在整个学习过程中所学的东西,包括所知、所能做的及其态度。”[2]因此, 质量测评体系应当明确或转移测评重点,以学生的学习效果为测评核心,改善现阶段重视政府、社会、学校提供的教学资源、条件、师资的弊端,实现测评重点从硬件建设向软件建设的转化。

2.测评体系的涵盖范围不全面

相对而言,思想政治理论的教学质量测评主要对学生知识掌握情况、技能掌握情况、情感与态度情况、价值观情况等进行准确评价,需要综合考量,给出整体评价结果,测评学生在社会生活和实践中运用马克思主义理论解决实际问题的能力。而我国现阶段的思想政治课教学质量测评仍然把重心放在课堂而非课外,放在期末而非平时,很少从学生的社会实践中的表现去考量理论课的教学效果和质量。

3.测评体系的方式简单划一

我们最常见的测评方式主要根据建立的思想政治理论课教学评估体系的制度与效果测评系统,通过测评因素的详细取证,鉴定教学质量与学生的学习情况,综合评价教师的教学态度与行为,并将测评结果纳入教师的年度考核当中,测评结果与教师考核、奖金级别、职称评定等方面相关,激发教师的动力。

(1)学生评教:是指学校组织学生对教师的教学行为及其态度、水平和方法等方面进行评价的活动。目前,学生评教最常见的方法是由学校管理部门(如教务处)提供统一的测评量表,在学期结束时由学生书面或在网上填写测评量表。

(2)期末考核:思想政治理论课最常见的期末考核方式有两种,一种是通过试卷考试完成答辩,教师按比例给出卷面成绩和课堂表现成绩,取综合分作为对学生理论课学习成果的核定。

三、有效构建思想政治课教学质量测评体系的几点思考

1.转变观念:生本教育理念的形成

教育工作正在从“师本教育”转变为“生本教育”,也就是从以教师为本转向以学生为本,通过激发学生自主学习的兴趣,提高教学效果。从重视学生的学习成果开始,逐渐转变教学思想,加强以学生为本体的思想政治教学,激发学生学习主动性的同时,也从改善教学条件、加强师资队伍建设等方面提升教学效果。

2.对象外延:开放式测评模式的应用

对思想政治理论教学质量的影响因素有很多,如教学条件、教学目标、教学任务、师资团队、学生态度等,这些因素都会影响学生的学习效果。教学不能只局限于课堂,而是要将理论内容同时纳入到课堂教学和课外辅导之中。课外辅导是指思想政治课教师在课外对学生进行个别或集体辅导,有个别辅导和集体辅导两种形式,其内容包括补课、指导作业、答疑等。课外辅导可以弥补课堂集体教学的不足,缩小学生成绩差异。因此,理论课教学质量的测评对象应外延到课外。另外,还应重点加强大学生与其家长对思想政治理论课教育的认知和理解,从而科学地进行满意度评价、学生素质测评及用人单位的综合评价等,共同测评整体教学质量。

3.实现途径:科学化

(1)促进思想政治理论课教学测评理论研究科学化。只有正确把握我国思想政治教育目标所处的发展阶段和基本国情,才能科学制定符合实际的测评制度,才能避免生搬硬套和表象化的测评研究;要明确思想政治教育测评是以思想政治教育的工作规范、行为标准为尺度,而不是以个体利益的实现程度为尺度;要明确测评的本质是针对思想政治理论教育所面临的问题采取解决措施,应始终围绕它的历史使命不断探索其具体功能及实现途径。

(2)促进思想政治理论课教学测评实践科学化。思想政治教育测评实践的科学化,需要尊重思想政治教育的发展客观规律,并重视绩效测评中的现实条件、测评方法及测评过程。

要通过流程的再造来对各个部门的职能重新进行界定,并确保部门间无职能重复、交叉情况出现,这样才能明确每一个部门和岗位的工作内容和范围,才能明确绩效标准;思想政治理论课教学测评指标体系建设,不仅要考虑到思想政治教育的社会与经济效益,同时也要对长短期效应、间接或直接效应进行考量,要对绩效测评体系的指标和测评基础资料数据库不断地加以完善和更新。

综上所述,高校思想政治理论课教学质量测评体系在不断发展与完善,我们必须根据国家经济的发展现状和社会需要,贯彻《全面提高高等教育质量的若干意见》精神,落实教学改革措施,提升教学质量,促进高等教育质量的持续可协调发展。

教育测量评价论文篇(4)

20世纪的学者围绕着“如何合理地衡量‘预期目标’和‘实际结果’的存在的差异”的问题展开研究, 30年代来自泰勒“目标达成评价”奠定了美国教育评价的基础。随着联邦政府对教育的投入,教育评价取得了繁荣和昌盛,对“目标达成评价”的批评来自两个方面:一是针对教育目标本身的攻击。反对该次课程改革的人们开始质疑课程改革本身是否能满足社会需要,也就是质疑教育目标自身的合理性问题,这就使得原本“中立”的目标评价对自身的价值产生了反思。二是针对教育目标实施过程的关注。这时人们关注的并不仅仅是目标的达成,而是在过程之中所具有的繁复情境,关注在各种情境下的参与者特有的价值立场。教育研究者对教育改革实施过程的关注使得参与者的价值立场凸现出来。这些批评带来了教育评价革命性的发展。与此同时,评价研究配合联邦政府的教育渗透政策,展开新的评价视阈的开拓。

一、屏蔽价值:目标达成的“科学”评价

20世纪30年代,美国俄亥俄州立大学教授泰勒 (Ralph W.Tyler)站在课程研制的管理者立场,将评价拓展到教育方案质量的评价。不过,这种拓展受到当时科学管理思想的影响,所谓的方案质量的评价指:将课程视为目标的存在。泰勒宣称评价是“测定教育目标在课程与教学的方案中究竟被实现多少的历程”,而评价的核心就是长存于历史当中的“学习经验(learning experience)的发展”。为此,课程评价的重点工作就是确立客观可信的标准和测量的工具,而工具应该能够囊括“教育目标所期望的行为的任何有效证据”,如纸笔测验(paper-and-pencil tests)、观察(observation)、交谈(interview)、问卷(question-naires)、收集实际作品(actual products)等。30年代早期,泰勒的评价方法在俄亥俄州得以实践。

经济大萧条时期(The Great Depression),学校和其他公众组织遭受资源短缺的困扰。此时,罗斯福总统(Roosevelt)开始进行政治上的新改革(New Deal Program)。在这个背景下,进步主义运动沸沸扬扬,泰勒参与了进步主义的运动,1932年开始领导著名的“八年研究”,并在卡内基机构(Carnegie Corporation)资助下,尝试比较不同学校教育的有效性。泰勒的教育评价(education evaluation)开始将评价拓展到教育方案质量的评价,“八年研究向全美的教育学者们介绍了更加广泛的教育评价,而不只是局限在学生的有效性和测验的范围”。而且,评价确定了预定的目标规范,关注预期目标的实现。泰勒以其研究的结果告诉我们,在预期目标和实际结果之间存在着巨大差异。早期的评价倾向于关注结果的测量,而把作为课程实施的重要环节——课堂和学校屏蔽起来,这种过程“黑箱”很快就引起了学者的反思。20世纪40年代以后,泰勒也对自己的工作进行了反思,其论著在以后的25年中产生了持续的影响。

20世纪40年代到50年代中期,美国城乡里弥漫着贫穷和失望,充满种族偏见和隔离,是一个资源浪费而人们熟视无睹的时代,是工业发展而危害环境的时代。但在经济的带动下,新的学校形式出现,学区的教育形成各种服务系统。社会和教育对教育的需求无限膨胀,但是人们很少关注教育的效率和有效性。不过,评价技术却得到了很大的发展,1947年成立的教育测验服务机构(Educational testing service)。20世纪50年代,联邦资金鼓励并支持专业研究活动,标准化测验已经得到广泛传播,专业组织建立了一系列规范测验指标。1954年,美国心理学家协会(American psychological association)提供《心理测量和诊断技术的具体建议》(Technical Recommendations for psychological tests and diagnostic techniques,简称APA)的报告。1955年,美国教育研究协会 (American education research association,简称AERA)和国家教育测量委员会(National council on measurement used in education,简称NCME)了《成就测验的技术建议》(Technical Recommendations for Achievement Tests)。1966年,前面三个机构联合了“教育和心理测量的标准手册”(Standards for Education and Psychological Tests and Manuals)并于 1974年进行了修订。

此时,标准化测量风靡一时,专家根据可接受的目标或目的建构测验,预先设定不同年龄或年级的常模或标准,用以管理、评级和解释分数的意义。包括性向测验(Aptitude tests)、成就测验(Aptitude tests)以及兴趣、个性和态度测验(Interest,Personality and attitude inventories)。这些标准测验方法看起来满足了科学化的要求,但在实际上却与泰勒规则相矛盾,因为泰勒认可并鼓励目标的差异性。不过,这些技术性的发展为未来评价的拓展奠定了技术的基础。

二、价值渗透:关注过程的“方案”评价

进入20世纪50年代,评估已经拓展到学生学习、课程设计的有效性之外,进入到教育系统、国家发展计划甚至是政策系统。评价者并没有遵照课程评价领域的前辈们的已有研究范围,而是将自己的研究领域拓展到公众领域的政策问题范围。50年代后期,教育领域资源的重组,随之产生了各类课程发展与教育的问题,评价的价值及其伦理问题已经成为评价领域的重要问题。

1957年苏联卫星发射成功的事件之后,联邦政府制定了《国防教育法》(National Defense Education Act,1958)。整个时期,联邦政府开始关注到教育的质量问题,开始资助大规模的评价计划,评价开始从“作为行业(industry)的评价到依靠税收的职业(profession)”。学科专家组织了科学和数学的课程发展计划(curriculum development project),不过很快人们就发现这些课程没有发挥其真正的力量,而且评价者的论著既无助于课程研制,也不对有效性的检测负责。1963年,心理测量专家克龙巴赫(Lee J.Cronbach)针对人们的抱怨,批评评价缺乏相关性和应用性,主张《通过评价提升课程》(Course improvement through evaluation),认为测验项目的分析和汇报有利于教师的教学,并建议课程评价必须聚焦于课程研制过程中课程专家的决策。但是,这并未引起美国教育评价领域学者的关注。

几年之后,情况变得不同了。1965年,肯尼迪总统智囊团的主席休伯特·汉弗莱议员(Senator Hubert Humphrey)和约翰逊总统(President Lyndon Johnson)对贫穷问题展开争论,人们开始将目光转移到社会福利的改革。20世纪早期积累的财富促使联邦政府开始资助这些福利计划。《初等和中等教育法案》(1964)(The Elementary and secondary education Act of 1964,简称ESEA)首次拨出特定联邦资金用于地区教育系统,教育被视为州的责任。随着联邦资金对地区教育的投入,国家开始干涉资金的运用效果。很多资金投入并未如地方宣称的那么理想,因此这些都要求教育者将教育评价转移到实践等支持性研究,学校开始接受ESEA的定期检测。由于评价可以终止或辅助课程项目,因此课程评价研究变得如此重要。费黛奥塔·卡朋(Phi Delta Kappa)联合会建立了“国家评价研究委员会”(National Study Committee on Evaluation),针对评价存在的问题进行调查。1960年后期,大部分美国教育学者都在着手于教育评价的研究,各类人员从不同的领域开始进入到教育评价领域,重新审视教育评价的本质概念。教育评价研究开始进入概念化(conceptualization)过程,这意味着对评价目标、评价对象、实施建议、服务过程,以及测量预定和非预定的结果等问题展开讨论。

1967年,美国教育研究协会(American Education Research Association,简称AERA)的罗伯特·斯蒂克(Robert Stake)对课程评价的研究引发了公众的关注。此时,评价者大多为心理测验学和实验设计人员,因此被人批评为缺乏教育问题的鉴赏力。其实,在1962年AERA会议之后,随着AERA的专论的出版,评价是教育测验的假设已经逐渐被摧毁。争论由此扩大化,就连泰勒(Ralph Tyler)、斯克里文 (Michael Scriven)和斯蒂克(Robert Stake)也开始批评心理测验手段是否可以用于满足评价的目的。1967年,斯克里文区分了形成性评价和终结性评价,“形成性评价”不仅仅是作为一种评价形式而被提出,它开启对过程与未来目标的重视。评价不再是单纯的心理测量技术,它需要容纳伦理的、政治的各种价值。到了20世纪70年代,就连专门从事测量的学者伯汉姆(Popham)也在提醒学生要关注伦理维度的新问题。接着,课程实施的过程开始容纳进入课程评价的眼帘。斯克里文的《应答性评价》(Responsive Evaluation,1974)、麦克唐纳(McDonald)的《民主的教育》(Democratic Education,1974)、里庇(Rippey)的《交互式评价》(Transactional education,1973)论著发表,这些论著鼓励参与者通过各种表达形式参与到课程改革中来,将课程改革拓展到更广泛的参与层面。

三、重构价值:关注评定的“综合”时代

1973年,评价领域开始成为一个专业研究和测验的领域。教育评价者的计划在20世纪70年代开始凸显,例如专业杂志《教育评价和政策分析》(Educational Evaluation and Policy Analysis)、《评价研究》 (Studies in Evaluation)、《评价和方案计划》(Evaluation and Program Planning)、《评价新闻》(Evaluation News)等陆续产生。专业机构如“五月十二日”(The May 12th Group)、H区域(Division H of AERA)、评价网络(the Evaluation Network)以及评价研究社会(The Evaluation Research Society)专攻评价研究。许多大学也开始设计评价方法的课程(不同于研究方法),例如伊利诺斯州立大学(University of Illinois)、斯坦福大学(Stanford University)、波士顿学院(Boston College)、加利福尼亚大学洛杉矶分校(UCLA)、明尼苏达州立大学(the University of Minnesota)、西密歇根大学(Western Michigan University)。各种形式的专业研究机构开始组建,如UCLA的评价研究中心(Center for the study of evaluation at UCLA)、西北地区教育实验室(Northwest Regional Educational Laboratory)、斯坦福评价联盟(the Stanford Evaluation Consortium)、伊利诺斯州教学研究和课程评价中心(the Center for Instructional Research and Curriculum Evaluation at The University of Illinois)、西密西根大学的评价中心(the Evaluation Center at Western Michigan University)、测验研究中心(the Center for the Study of Testing)、波士顿大学评价和教育政策机构(Evaluation and Educational Policy at Boston College)等。交流会导致各种嘈杂的声音,专业机构之间的合作虽然增多,新的专业组织加强了交流,并降低了评价领域的碎片化。这些机构对评价进行研究,甚至出现了对评价质量进行研究的元研究(meta-evaluation)。学者们在不断寻求适当的方法,增加交流和理解,评价的技术得到发展。

在这个时代,评价者意识到评价技术必满足各种各样的需求,委托人的需求、中心的价值、真实的情况、探究的需要、精确的要求,评价的方法得到了发展,例如,目标游离评价(goal-free evaluation, Scriven,1974,Evers,1980)、支持一对手小组(Adver-sary-advocate teams,Stake & Gjerde,1974)、支持小组(Advocate teams,Reinhard,1972)、元分析(Meta analysis,Glass,1976;Krol,1978)、应答性评价(responsive evaluation,Stake,1975)、自然主义评价(naturalistic evaluation,Guba & Lincoln,1981)等等。此时,更受人青睐的是案例研究(case study),案例分析可以避免破坏其他参与者对潜在事件的透视,它不仅仅作为汇报的方式,更是提供了丰富信息。1980年,12个关心教育评价问题的组织构成了联合委员会,共同了文件《教育方案、计划和资料的评价标准》(The standards for evaluation of educational programs,projects and materials),1981由麦格罗·希尔(McGraw-Hill)出版公司出版。

随着联邦政府对教育领域的渗透,评价开始作为政治的行动,评价者以智囊团的方式存在,努力地为相关的政治社区提供信息。克龙巴赫也将评价纳入了政策的领域,认为评价主要是提供信息、思考和决策的材料。20世纪的最后十年,教育评价已经成为一个成熟的专业领域。不过,专业机构之间的合作虽能很好地用于提升行为和提高评价的质量,实际的评价却很少发生变化;而且,人们需要教导评价者如何获得、尝试、反馈和发展新的评价技术。

四、研究发展的两条路径:反思范式的递进

教育投资体系的变革对评价研究的发展提供了物质基础,评价研究问题领域的成熟带来了评价理论的演进。第一,评价对象不断得到拓展,从单纯学生成就评定到教学过程的评定,以课程领域为例,从课程目标的评价到整个课程改革方案(如CIPP模式,即context,input,process,product)的评价。第二,评价目标从单一到多样,从衡量预期目标的达成,到关注实施过程中的即时目标达成。第三,评价标准多元化,随着对实施过程的重视,实践过程的各种参与者的立场开始被评价者关注,这种参与者的价值渗入影响了评价研究的发展。第四,评价方法的宽容,随着评价对象的拓展、评价目标的多样、评价标准的多元,评价方法也发生了相应的转换,从单一的测量方法,到关注实践历程的人类学方法。

对教育目标的攻击、对教育方案实施过程的反思促动了教育评价的发展路向:首先,针对教育目标本身的攻击去除了所谓的客观价值的假象,教育评价的作用从“证明(prove)”走向了“改进(ireprove)”。如1972年,斯克里文提出的目的游离评价(goal-free evaluation,简称GFE)模式,将评价的重点从“课程计划预期的结果”转向“课程计划实际的结果”。他认为一般评价是为了检测“是否能够达成预先存在的目标”,从而忽略了那些积极的非预期的结果。在他看来,评价的原则应该是“有效的结果”而非“目标”,为此评价者必须意识到所有的结果,还要创建一个被评价对象的档案袋。“空白课程”的提出者艾斯特在《教育的想象》一书中提出要以“表现性目标(the expressive objectives)”为标准,进行“启示性评价(illuminative evaluation)”。

其次,为了促进方案的改进,教育评价的对象发生了变化:以课程领域为例,必须针对课程研制的全面过程采取考察。就将课程实施的背景(context)、过程(process)、成果(product)全部纳入评价的范畴,如20世纪60年代的CIPP方案评价模式、60年代后期应用广泛的评价学习中心(Center for the Study of Evaluation,简称CSE)评价模式等。当我们发现课程评价已经转向“教程的决策”、“关于个体的决策”和“行政的调控”的时候,就不得不意识到课程本身所具有的计划性、目的性与组织性。因此,人类学的方法开始作为评价方法的基础,如“应答式评价(responsive)”、“启示性评价(illuminative)”或“案例研究”等。

再次,由于容纳了相当多的评价对象,也就是说将各种时空的人的价值都纳入其中,为此课程的评价标准也发生了变化,从“有效”的功利价值到包含了“生命”原则的伦理价值。故此,人们开始关注课程评价的价值主体、价值主体的需求问题。既然如此,在评价的过程中就需要关注到评价者、被评价者各自的价值立场,注意到评价标准和评价对象之间的匹配,关注到评价手段与评价对象的匹配。现代课程评价研究力图在制定评价标准、收集评价资料、采取评价方法上能够兼顾到更多价值取向。

藉着对评价历史的回顾,我们可以看到直到今天为止,这些变革造就了三个具有差异的评价范式(见图1),每个范式都具有自己的目的、偏好的技术、关注的焦点等等。由此,我们便获得了对研究发展的一种沉思:现代化促使我国的教育研究面临着巨大的危机,我们的学者不得不一边追赶,一边进行着反思,步伐在国际化与本土化之间交替,踉踉跄跄地前进。研究主题的变化代表了一种景况的转变,以及对研究者自身角色和地位的反思。

图1

课程评价范式图解

参考文献:

[1][美]泰勒。课程与教学的基本原理[M].中国台北:桂冠图书有限公司,1981.119.

[2][美]泰勒。怎样评价学习经验的效用[A].施良方译。瞿葆奎。教育评价[C].北京:人民教育出版社,1989.265.

[3]施良方。课程理论——课程的基础、理论与问题[M].北京:教育科学出版社,2000.156.

教育测量评价论文篇(5)

引言

教育评价对提高教学质量、促进教育改革的深化具有重要的作用,主要包括诊断功能、导向功能、激励功能以及调节功能。有人说,教育评价改革已成为当今基础教育改革与发展的瓶颈,但是目前教育评价的改革却很难取得突破性进展,一方面,是因为这项改革涉及教育教学的各个核心领域,教育评价中诸多问题本质上正是社会矛盾在教育中的转嫁与具体体现,特别是人才标准、社会价值取向和经济发展状况等,都会直接制约教育发展的理念和改革进程;另一方面,是因为我国基础教育评价的理论和技术研究相对薄弱,尤其是教育测量和评价技术整体上还处在较低水平。可见教育评价技术在教育评价、教育发展与改革中具有重要作用。

纵观教育评价技术的发展历史,其与教育技术的发展是信息相关的,本文主要从教育技术的发展历程来简要介绍教育评价技术的发展。

一、相关概念的界定

1.教育评价

“评价是一种价值判断的活动,是对客体满足主体需要程度的判断。而教育评价是从教育测量活动中逐步发展出来的,是对教育活动满足社会与个体需要的程度做出判断的活动,是对教育活动现实的(已经取得的)或潜在的(还未取得,但有可能取得的)值做出判断,以期达到教育价值增值的过程。教育评价往往把教育测量作为它的基础,“按照教育评价的主体分为个体评价和社会评价,按照教育评价的目的分为形成性评价和总结性评价,按照教育评价的范围则分为学生评价、教学评价、课程评价、学校评价、大群体评价、特殊方案与项目的评价以及人事评价”等多个方面。冈而教学评价是一种中观和微观的教育评价。

此外,教育评价也不等同于教育测量,但二者有着密切的联系,教育测量是教育评价的基础,教育评价是在教育测量的基础上的深化。

2.教育技术

根据AECT’94教育技术定义:教学技术是为了促进学习,对有关的过程和资源进行设计、开发、利用、管理和评价的理论与实践(In-structional Technology is the theoryand practice of design,development,utilization,management and evalua-tion of processes and resources forlearning)。AECT’05教育技术定义:教育技术是通过创造、使用和管理合适的技术性的过程和资源,以促进学习和提高绩效的研究与符合伦理道德的实践(Educational Technol-ogy is the study and ethical practiceof facilitating learning and improvingperformance by creating, using andmanaging appropriate technologicalprocesses and resources)。

3.教育技术中的评价

评价一直是教育技术定义中的一个重要组成部分,是确定教学和学习是否合格的过程。根据1970年教学技术委员会的第二项定义:“‘教学技术’是一种根据特定目标来设计、实施与评价整个学与教的过程的系统方法,它以对人的学习和传播的研究为基础,综合运用人力、物力资源,以达到更有效的教学的目的。”1994年的定义更是将评价作为教育技术研究的五个范畴中的一个方面,主要是针对学习资源与学习过程的评价,其内容主要包括问题分析、标准参照测量、形成性评价和总结性评价。教育技术评价又是教育评价的一个子范畴,所以,教育评价的基本原则和方法同样适用于教育技术的评价。

4.教育评价技术

目前尚没有对教育评价技术有一个权威统一的定义,也有些学者认为教育评价技术与教育评价方法是相同的。《辞海》(1999年版)中规定了技术的定义是在劳动生产方面的经验、知识和技巧,也泛指其他操作方面的技巧,英文是technology,art, skill, technique。现在也有很多学者认为技术是科学的其他有组织的知识在解决实际问题或完成现实任务中的系统运用,包括物化技术和智能技术。

教育评价技术,就是在教育评价的过程中所采用的一些经验、知识和技巧等。

二、从教育技术的发展到教育评价技术的发展

对于教育技术的发展历程,人们普遍认同的是关于教育技术的“四次革命论”的提法。最早是英国著名的教育家阿什比(Ashby)在以色列技术学院做题为《教育中的技术学》的演讲中说“在漫长的教育史上曾有过四次智力革命”。其主要的内容有以下四点:第一次革命是教育职能由家庭转移到基督教会或犹太教会;第二次革命是采用了书写作为教育的工具;第三次革命是印刷术的发明;第四次革命是上世纪在教学上开始采用的新技术,如电影、唱片、电视等。

1978年,由原美国驻中国联络处印发的小册子—《美国教育技术》中写到了四次革命论:第一次革命是教育青年人的责任从家族转移到专业教师手中;第二次革命是采用书写文字作为与口语同样重要的教育工具;第三次革命是发明印刷术和普遍运用教科书;第四次革命正在出现,主要是近年来电子学、通信技术及数据处理应用于教育。

以上两种观点基本上是一样的,都是从媒体的发展对教育方式产生的影响进行分类的,是侧重于媒体进行划分的。

教育评价是从教育测量、教育测验活动中逐步发展出来的。在20世纪30年代才由“教育评价之父”泰勒提出了“教育评价”(educationevaluation)的概念,“从而把教育评价与教育测量区分开来,教育评价学就是在泰勒原理的基础上诞生并发展起来的”。纵观教育评价的发展历程,“其思想源于中国古代教育的考试,孕育于西方教育测量的批判,形成于‘八年研究’的改革实践”。

教育评价的理论和技术也一直伴随着教育的发展而发展,本文就主要从教育技术发展的四次革命简单介绍教育评价技术的发展历程,并展望教育技术在教育评价中的未来发展趋势,如表1所示

1.专职教师的出现

第一次革命是专职教师的出现。此时的教育评价技术主要侧重于口头提问和实际操作来评定学生的学业。我国早在西周时代就已经形成了较完备的考试制度。如《礼记·学记》中记载,“比年人学,中年考校”就是典型的实例。而在西方,“古希腊哲学家常采用评论、谈话等方式来进行考核,提倡辩论,注重学生的思维训练。最为有影响力的就是苏格拉底的研讨评价法”,这一方法是指以苏格拉底“产婆术”教学法为基础,通过苏格拉底式的提问和积极参与研讨,以实现思想和价值理解扩展的质性评价活动。

2.书写文字的出现

第二次革命是采用书写文字作为与口语同样重要的教育工具。文字的出现使笔试成为了主要的教育评价的技术。我国历代封建王朝为选拔人才,建立了“开科纳士”、“分科举人”的考试制度,历史上称之为科举考试制度。试卷测验是教育中应用最为广泛的评价技术,它是根据教育目标,通过编制试题、组成试卷对学生进行测试,引出学生的学习表现,然后按照一定的标准对测试结果加以衡量的一种评价方法。采用试卷测验作为评价技术只是属于测量的阶段,只是追求评价结果的数量化、客观化为主要目的。

3.印刷术的发明和教科书的出现

第三次革命是印刷术的发明和教科书的出现。这一阶段还是采用笔试的教育评价技术,教育测量和教育测验仍然是重要的评价技术,但已经不再是唯一的工具了,评价者的任务不仅是要运用一定的测量手段搜集评价信息,还要制定判断评价的目标与评价标准,运用一定手段进行价值判断。教育测量和教

育测验是用数学方法对事物或现象进行描述,是为了取得客观的数据,客观性是测验质量的首要指标。这种教育评价技术从出现到现在仍普遍运用于国内外教育评价中,比较常见的测验类型有常模参照测验和标准参照测验。

(1)常模参照测验,“指参照常模群体的水平解释分数的测验。常模群体可以是一个特别选定的团体,也可以是被测所在群体的本身。参照常模解释分数,突出反映了被试在常模群体中的相对位置,便于进行比较和选拔,适用于带有竞争性质的人学考试、竞赛以及为相对评价提供信息的各种测验”。

转贴于 (2)标准参照测验,指依据某种特定操作标准可以直接解释测量结果的测验。操作标准一般可通过界定个体所应该完成的任务集合或任务领域来确定。“标准参照测验主要用作鉴定,高中毕业会考、自学考试等就是典型的标准参照测验。在平时的教学中也经常采用标准参照测验进行诊断性评价或终结性评价”。

4.电子、通信、网络技术在教育中的应用

第四次革命是近年来的电子技术、通信技术以及网络技术在教育中的应用。由于计算机和其他新型媒体技术的出现,信息技术的发展以及质的研究方法得到重视,教育评价技术也出现了很多新的方式。例如在英语口语和听力考试中开始利用录音机或者语音实验室等设备来辅助测试,还有伴随程序教学法出现的计算机辅助评价、契约评价、量规评价、电子档案袋、情境评价以及目前研究比较热门的基于绩效技术的评价、基于数据挖掘技术的评价。其中几种评价内容如下。

(1)计算机辅助评价(ComputerAssisted Assessment,简称CAA)“指在评价学习者的知识、技能和能力的过程中引人计算机作为工具或手段,它引发了评价内容、方法和形式的深刻变革。从测评的内容和目标分类的角度来划分,CAA可分为知识测评和技能测评两大类,它们共同构成能力素质测评的基础。”把计算机引人教育测试领域进一步激发了人们开发新的测试技术的兴趣,这种测试技术不仅利用了计算机的高速数据处理能力,而且还利用了计算机的交互能力,海量数据的即存即取能力,新颖的图像处理能力,以及控制多媒体环境的能力。随着目前网络教育、远程教育的发展,计算机辅助评价又有不受时间和空间限制的特点等,对教育评价的发展具有深远的影响。

(2)契约评价:“来源于真正意义上的契约或合同。教育技术强调以学为主,以‘任务驱动’和‘问题解决’作为学习和研究活动的主线,为了能够让学习在完成任务和解决问题时有一个具体的目标或依据,也为了客观合理地评价,契约评价这种评价方式越来越受到人们的重视。目前比较常见的是学习契约,也称为学习合同,“是一种由学习者与指导教师共同协商、设计、实施和评价的关于某一学习主题的书面协议。在学习过程中,这种契约可以不断修正,它赋予了学习者自主学习的决定权,规定了学习者必须履行的学习义务,为学习者开展自主学习提供了一种基本框架”。它规定了学习者将要学习什么、怎样学习以及如何检验/评价是否达到学习目标。在远程学习中,将学习契约与信息技术有机结合,将有益于提高评价的效度。

(3)量规(Rubric ):“是一种结构化的定量评价标准,往往是从与评价目标相关的多个方面详细规定评价指标,具有操作性、准确性高,主观与客观相结合的特点。随着教育信息化的发展,越来越多学习任务是以非客观性的方式呈现的,因此,量规的应用逐渐得到重视。在设计量规时,应该注意两条原则:根据教学目的和学生的学习水平来设计结构分量;根据教学目标的侧重点确定各结构分量的权重。目前所提倡的以学习者为中心,基于任务驱动、项目学习或问题求解的学习活动,“其学习过程和学习成果通常是以研究报告、学习反思、调查报告、研究论文等形式呈现,这种学习绩效评价所要求的评价方法/工具不但要关注学习结果,更要关注学习过程。量规是一种适用于评价这种类型学习绩效的方法//I具”。

(4)档案袋(Portfolio):也称为成长档案袋,“是按照一定目的收集的反映学生学习过程以及最终产品的一整套材料,对学生进行客观的、综合的评价”。其使用在客观上有助于促进个人的发展,学生也能在自我评价中逐渐变得更加积极。评价包可包括各种形式的学习材料,如作业、录像带、书面文章、图画、成绩单、调查报告、教师的评语等。档案袋在计算机出现以前就存在于教育评价中,只是由于信息量大,存储资料费时费力,并没有得到广泛的应用,电子档案袋出现以后就解决了以上问题,可以更好地发挥其评价的作用。

(5)绩效评价:“学生个人或小组针对某一主题,独立完成任务,并以PPT文档、电子作业、网页、解决方案、研究报告等方式来展示绩效,已经成为一种得到认可的学习形式。绩效评价涉及学生创造成果或完成所要求任务的过程。绩效评价需要一整套辅助工作,如学生作业的观察、展示、陈述、访问、学生生成的计划、模仿以及角色扮演等。为了绩效的真实性,它们应与真实世界或该世界的某些方面保持联系,即使不是真实的任务,也应该是有意义的任务,不能是对知识的回忆。好的绩效评价反映了真实世界的复杂性并同时对许多方面进行测量。在绩效评价中,学生有机会展示广泛的才能,任务的完成使学生有可能起到类似真实世界场景中所期望的角色。通过绩效评估,学生意识到学习不仅仅是记忆的练习,而且是发展既有具体训练的深度又能适应所学领域的复杂性的一种感悟。

(6)数据挖掘(Data Mining):就是“从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程”。数据挖掘有时也称为“数据库中的知识发现”(Knowledge Discovery inDatabase , KDD ),还有很多和这一术语相近似的术语,如数据分析、数据融合以及决策支持等。它涉及对数据库中的大量数据进行抽取、转换、分析以及模型化处理,从中提取辅助决策的关键性数据。通过数据挖掘,可以帮助决策者寻找规律,发现被忽略的要素,预测趋势,从而进行决策。在教育评价中,收集到的教育信息数据量较大,而且存在一些特殊的数据,利用数据挖掘技术可以深人挖掘这些数据,消除冗余数据和没有价值的数据,对评价主体进行多指标、多主体、全过程、全方位的整体综合评价,使教育评价更加公平、公正、合理

教育测量评价论文篇(6)

一、看待基础教育质量标准及检测或监控的不同视角

基础教育的质量、质量标准、质量评价、质量检测或监控等,是与会者共同关注的基本问题。大家从多种视角看待上述问题。特邀报告多为宏观视角。专题研讨会论文的视角可分为理论的、区域的和学校的三个层面。

基础教育质量包含的内容过多。办学质量、师资质量、课程质量、教学质量、人的全面发展质量等,都是基础教育质量必须包含的内容。观察基础教育质量的立场和角度也太多。宏观、中观、微观,理论、实践,历史、现实、未来,政府、社会、学校、家长,不同视角的观察,获得的结果和结论有所不同。特别是对于基础教育质量、质量标准的看法存在很多差异。

特别需要澄清的是,监控意义上的基础教育质量,指的是教育的质,而不是教育的量。质的意义上的教育质量,对应着以课程标准为核心的明确的标准(课标),与课程标准相对应的评价(监测或监控)只能用达标与否来表示。也就是说,质的意义上的教育质量,只有一个质的标准,判断的方法,就是看其是否完成了这个任务、达到了这个标准。《教育规划纲要》提出的建立国家基础教育质量标准,就是质的标准;建立基础教育质量监测或监控机制,就是通过恰当的、适用的评价形式,保障全国基础教育都能够完成教育任务、达到教育标准。

量的意义上的教育质量对应的是教育结果(有时还延伸到教育过程)的优劣程度。通过恰当的、适用的评价方法,对教育优劣程度作出判断,将不同地区、学校及教师的教育教学质量水平区分出来,能够给学校或教师的工作质量的高低或优劣进行排名。所谓“不断提高教育质量”,指的就是这种量的意义上的教育质量。

将质和量加以区分,有助于梳理对质量监控的认识,也便于质量监控工作的操作,在某种意义上还有助于对社会和大众的宣传。质,是达到目标,并且是百分之百达到。量,是“更高”、“更好”、“更多”、“卓越”、“优质”。政府、学校和教师的法定任务是完成质的目标,学校和教师在完成质的目标的基础上,可以努力达到更高的质量,但那不是当前质量监控的重点。质量监控,首先是质的评价和保障,其次才是量的追求。

基于不同的目的,质量监控应采用不同的评价形式;使用评价方法不同,获得的评价结果就不一样。测查教育质量的高低、好坏、优劣程度,适用于相对评价方法。相对评价方法的基础是群体均数、常模之类的客观标准。监测或监控基础教育质量是否达标,适用于绝对评价方法。绝对评价的基础是制订基础教育质量标准,比之“常模”,这种标准带有较强的主观性。基础教育质量标准是以课程目标为核心而确立的学校、教师和学生必须达到的教育和学习目标。通过绝对评价,可以准确而高效地监测或监控质量目标的完成情况。至于在实现标准之后,如何追求更高的、卓越的、优质的教育质量,就不是教育质量标准所关注的问题,因此也就不是教育质量监测或监控所应考虑的问题了。倘若在讨论制订基础教育质量标准问题时,不能在理论上和思维方式上剔除“更高”、“卓越”、“优质”这些旨在反映目标标准之上的量的提升情况的修饰词,就容易在质和量的问题上出现摇摆,就容易说不清基础教育质量监测的任务究竟是为了改进工作,还是为了给地区和学校乃至教师和学生进行排名。

研讨和论文中还涉及两个基础性概念,一个是监测,一个是监控。厘清这两个概念也有助于推进对基础教育质量问题的研究和实践。这两个概念涉及测、监、控三个字,分别具有不同的含义。测,是方法和技术,是手段,表现为测量工具的开发和应用;监,是实时掌握和了解质量状态,是对质量的充分把握、切实把握,表现为一种常态化的运作机制建设;控,是控制教育质量和保障教育质量,表现为一种使基础教育尽快达到国家标准的保障制度建设。基础教育质量监测是以质量标准为基点,测查教师的教学和学生的学习是否达到了目标。当然为了保证教师的教学和学生的学习,需要监测的还有学校的管理及其他教育质量的主要影响因素。建立一种质量控制的机制,以保证基础教育能够完成教育标准。在当前我国的教育体制中,督导或督学制度是实现监控的主要途径之一。测在前,控在后,测是技术的表达,控是制度的表达。监控比之监测,多出来的正是对质量保障制度的诉求。

二、从量的评价转向质的评价,从相对评价转向绝对评价

制订基础教育质量标准,是开展基础教育质量检测或监控的逻辑前提。依据质量标准而实施的评价属于绝对评价。我们要开展质量监控,首先需要实现评价观的转变。近年来,社会普遍信服客观标准,相对评价属于比较偏重于客观标准的评价(常模),绝对评价则偏于主观,但是质量监控需要的恰恰是要制订一个适合当前工作状态的主观标准(人为制订)。

从宏观角度看,在国家和一个相对大的区域层面,需要有意识地排除通过评价给地区和学校排序、评比的做法。宏观层面所谓转变评价观念,就是要强调基础教育质量监控的是质而不是量,是教育目标的完成情况以小学语文课程为例,课程标准对识字数量是从学生认识的字数和会写的字数两方面来要求的,学生认识的字数在第一学段增幅为1600字~1800字,会写的字数在第一学段为800字~1000字。这两个数字构成了教育质量的监控标准。但是有些地区和学校,把标准中的“一会”提高为“两会”(不仅会认,还要会写1600字~1800字,超标一倍),“两会”再提高为“四会”(会认、会写、会读、会用),对于这些做法,我们应该给予什么样的评价呢?给予“达标”,似乎不足以说明其质量的“高超”程度,给予“良好”和“优秀”,则又非质量监控的本意,也不是课程标准的本意,甚至还可以说是对课程标准的某种僭越和批判——要求二年级的教师和学生完成四年级的任务——课业负担就是这么被加重的!

对于学生及其家长而言,认字越多越好,这是量的评价,是相对评价的任务;对于学校、教师及政府而言,完成课程标准就好,这是质的评价,是绝对评价的任务。识字教学这个例子说明,可以“不断提高”的,只有量,没有质。

当然,一般来说,宏观和微观视角中的教育质量监控的实际含义多少有所不同。

宏观、中观的视角,重在监控底线,须用绝对评价方法。微观的视角中,重在考查程度,既可用绝对评价方法,也可用相对评价方法。假如以15秒为学生百米跑的速度标准,代表体育教学目标,那么我们可用绝对评价方法予以监控。凡15秒以上者为达到目标、完成任务、质量合格。但对于14秒、13秒、12秒、11秒的学生是否就意味着质量很高?要不要更高?在宏观和中观视角中即绝对评价中,后面的问题都不成立!只有在微观视角中,才可以说,跑11秒和15秒之间意味着什么差异。美术、音乐等艺术和技能性课程都如此,知识性课程、道德性课程同样如此。比如:学生做志愿服务或社会实践的时间,20课时为达标、合格。可以倡导或鼓励个别学生争取30、40个课时,并予以表扬,但不能作为质量标准。换言之,质的评价,是针对15秒、20课时的达标性评价。它不太关注14秒、13秒,30课时、40课时的问题,相反,它非常关注16秒和19课时所反映出的教育教学工作问题。

及存在的问题。基础教育质量监控的“达标”性质和“保障”目的,决定了绝对评价是比相对评价更加适宜的评价方法。

从微观角度看,由于绝对评价依据的是教学目标,是一种质的评价,因此它有助于我们发现教学中的问题,其结果对于改进工作具有重要价值。而相对评价依据的是群体均数,是一种量的评价,它有助于发现个人差异,其结果具有很客观的评比、排名作用。所谓转变评价观念,就是依据提升教育质量的目的,微观层面的学校和教师,都应该将适应于“完成既定教学任务,发现教学中存在的问题以便及时改进”的评价方法作为主要方法,而压缩和减少使用相对评价方法。

无论宏观角度的监控还是微观角度的监控,都应遵循把握教育质量的“质”这个逻辑原则。《教育规划纲要》中提出的制订基础教育质量标准所预示的对应的评价性质是质的评价,对应的评价技术是绝对评价。如果说我们曾经在新课程改革过程中一度比较重视应用相对评价的技术和方法,如比较重视课程及教学目标的生成性,重视研制各种常模,以便于评价每个孩子(与群体均数相比)的发展情况,那么,国家层面所要监控的必定是教育教学目标的达成程度。相对评价一般使用等级分数,自然能够评出名次;绝对评价一般使用达标线,只能分出是否达标,而不能细分名次。

当前,基础教育质量评价面临的问题是多方面的。

重量轻质,并把量当成质,是当前的一个主要问题。当我们把一个本来有目标、有标准的事物由于美好的愿望而有意抹杀其质的标准,使之变为一个具有无限弹性的事物时,“不断提高”这四个字,就从愿望性的口号变成了现实政策。在“不断提高教育质量”的观念下,是无法确立和制订质量标准的。没有标准,便无法确定恰当的、适用的评价方法;没有明确的评价方法,便没有切实的监控。“不断提高”只是此类愿望性口号的代表,实践中还可以看到花样翻新、五光十色、丰富多彩的不断创新的概念说法(优质的、卓越的、高标准的、可持续发展的学生等)。这些说法的目的并不在保障教育质量方面,而仅在于如何“不断”提升名次,以达到“出人头地”的目的。在几篇介绍香港基础教育质量监控的文章中,我们也可以清晰地看到这样一个转向的趋势:基础教育质量监控的评价从重视输入、过程,向重视结果方面转化,从重视量向重视质方面转化,从重视“虚”向重视“实”方面转化,从权力控制向评价监控方面转化。

有论文鉴于目前流行的评价方法对教育质量的结果评价只有好坏、优劣、高低这样的表达方式,而提出用模糊综合评价模型来处理这个问题。这在实践中也是一种被大家普遍接受的方式。但是,在好坏、优劣、高低之前,还存在一个“是否”、“有无”的问题,而“是否”和“有无”所针对的,恰恰是基础教育质量的标准所在,是质量的“质”所在。

时龙理事长在讲到质量标准框架时,提到了一系列相关工作,概括地说,主要包括:一制订标准,二研制相应的技术、方法和工具,三建立监测机制,四建立控制、保障机制。这四个要素构成了基础教育质量监控的完整架构。

香港教育质量检测和保障的基本机制包含三个圆圈,小圈指学校层面对于质量的监控,中圈指区域层面对于质量的监控,大圈指国际层面对于质量的监控。它给我们的启示在于,这三个圈完全符合质量保障和质量管理的一般思维和实践逻辑,管理学上称之为PDCA质量圈(计划、实施、评价、改善)。香港的质量监控机制对我们研究、设计、实验基础教育质量监控的方案和计划,具有重要的参考意义。

基础教育质量监控应该是一个逻辑严密的系统。这个系统所包括的四个基本环节(质量标准——评价技术——检测方案——保障制度)的相互关系应该是:质量标准是基础,是当前的工作重点,是评价或监测的指标构成。监测(评价)方法和工具是与质量标准相配套的技术手段,是教育评价研究者最为关注的重点。监测方案是以与质量标准相关联的评价技术为核心而建立起来的一整套教育质量监测机制,这套机制也可视为基础教

三、构建教育质量监控体系的四个基本要素及其相互关系

育质量监测的解决方案,目前国家和各省市正处于尝试研制和试点建立阶段。第四是依据这套监测机制或监测方案而构建的质量控制和保障制度,这是通过对现有教育管理制度进行以保证质量为目标的整合而形成的新的基础教育管理体系。具备了质量控制和保障机制之后,质量标准才能真正得到全面落实。

目前来看,要建立基础教育质量监控体系,我们还有许多问题需要澄清,有观念方面的、习惯方面的、认识和理解方面的,体制、机制和制度方面的,也有技术和操作方面的。

我们首先要解决的问题是制订基础教育质量标准。

这项工作的艰巨性主要表现在三个层面:思想理论层面、政策制度层面和方法技术层面。

在思想理论层面,“优质”、“均衡”、“人民满意”等观念混淆在一起,不利于在“什么是”基础教育质量标准问题上取得价值共识。许多地区在为义务教育均衡发展制订阶段目标时,都把“优质均衡”或“高质量、高水平均衡”作为一个阶段目标的标志,说明在义务教育均衡发展问题上普遍存在认识上的混乱。优质与均衡分别体现着不同的价值取向。价值的多义性,导致基础教育政策的多标准性;政策的不稳定性,导致教育评价及质量监控工作的盲目性和模糊性。

在政策制度层面,监控体制的建设涉及教育行政部门、教育督导部门、教育研究部门以及其他相关部门的职责和权利的整合与合作。近年来,各地教育行政部门在做各种机制调整的尝试,各级督导部门也在积极开展质量监控的理论和实践探索。这个层面的问题是当前推进基础教育质量监控工作的关键。其深层,关乎思想理论的进一步澄清;其表层,影响着评价技术操作方面的研究和推进。

在方法技术层面,制订基础教育质量标准,所面临的首先是质量标准的研制问题,而不仅是测评工具、分析手段等问题。教育质量监控是以课程标准为基础的,即虽然课程标准是主观制订的,但我们必须假定它是合理、合法的(虽然有与会者提出课改后新课程标准存在种种问题)。课程标准可分为三个维度的内容,一是知识、技能维度,二是思维、表现维度,三是态度、情感维度。知识、技能部分对应的标准是理解和掌握;思维、表现部分对应的标准是判断和表达,态度、情感部分最为复杂,课标对此的表述是态度、情感、价值观,在实际操作中,如北京的综合素质评价,还包括学习兴趣、自信心、意志力、积极性等。态度、情感、价值观的可测标准怎样确定?这是多年来一直困扰大家的难点问题,但并非不能解决。当我们首先确定质量标准是“准则参照”而不是“常模参照”,对应的方法是绝对评价而不是相对评价时,这个问题就会在相当程度上变得比较清晰也比较容易操作。

质量监控,核心是保障教育活动完成既定目标。香港在质量标准的基本分类中,同样包含“学生表现”和“校风及学生支援”的范畴。该范畴的“范围”表述(学生支援、学校伙伴,态度和行为、参与和成就)和“指标”表述(学生成长支援、学校气氛,家校合作、对外联系;情意发展和态度、群性发展,学业表现、学业以外表现),这两个层次的表述方式,形成了一种“准则参照”体系,并在相当程度上具备了“是否”、“有无”的基本特征。由此可见,即使是对于态度、情感、价值观这方面的教育目标,只要排除了量的无限要求,其质的部分,还是可以通过我们的细致工作,加工成为可测的指标体系的。上海教科院基教所陆关于上海地区参加2009年PISA测试情况的报告,也向我们展示了PISA怎样成功地测查了态度、情感和价值观方面的内容。

四、基础教育质量监控理论与实践今后可能的发展方向

作为基础教育质量监控的核心问题的评价体系及其方法,可能需要我们向着逻辑化、技术化和艺术化方向进一步深化研究。评价体系及其方法的逻辑化,指的是强化质量监控体系的科学化程度;技术化,指的是强化质量监控体系的实用化和便利化程度(如指数化、色标化、概念化等);艺术化,指的是强化质量监控体系的平等、尊重、友好、善意、和蔼、亲切等美感友善的程度。艺术化主要在微观层面的应用中需要特别加以注意,以便于学校和教师愿意自觉地、愉快地应用。

评价方法和技术没有好坏之分,只有恰当与否。根据不同的评价目的,选取恰当的、适用的评价方法,是正确的做法。如相对评价对于发现学校或学生的发展问题而言,是好的评价方法。绝对评价对于监控既定教育质量目标的完成及工作改进情况而言,是好的评价方法。

我们始终面临着一个十分纠结的问题:如果说质量标准的制订从理论上讲指的是“最低标准”的话,那么,我们多年来习以为常的一些概念,诸如优质、卓越、高水平、拔尖创新、学生的可持续发展等等,又怎么理解、怎么对待、怎么处理?换言之,怎么不断鼓励学校办出特色,不断鼓励教师提升教学水平,不断鼓励学生提高学习成绩?这个纠结,根本原因在于,监控者(政府)确定的质量标准不是质的标准,而是量的标准;使用的评价方法,不是旨在达标、在发现问题以改进工作的绝对评价,而是旨在区分发展差异、旨在评比排名的相对评价。

其原因还在于,应该属于学校校长甚至教师的某些权力,在一定程度上还被掌控在政府教育管理部门,质量监控与业绩考评与评比竞赛等混杂在一起。这些,都有待于教育体制、制度和机制的进一步改革。教育质量监控工作一方面是一项有助于促进教育改革的工作,一方面它又需要通过教育改革的深化才能逐渐完善起来。

教育测量评价论文篇(7)

    1978年实施的《全日制十年制中小学体育教学大纲(试行草案)》首次在考核项目中设置了素质项目,促进了“课课练”在体育教学中的应用,使增强学生体质的目标在体育教学中得到落实,评价领域主要集中在速度运动素质、速度耐力运动素质、爆发力运动素质、力量素质运动技能及力量素质方面,而且把学生体质是否有所增强作为评定学校体育工作成绩的标准,这一评价思想一直影响至今。

    这一阶段由于“文化大革命”十年的影响,真正开展学校体育评价工作的时间较短,也未形成完整的理论体系,评价思想及模式也仅散见于有限的规范性文件当中。总结建国到1978年时期我国学校体育评价工作可以发现,由于全盘苏化、“大跃进”和“文化大革命”的影响,和同时期国外教育评价理论和实践研究快速发展相比,我国的理论研究近乎一片空白。评价的实践工作虽然仅集中在对学生体能的测试方面,但其活动的进行为我国当时学校体育工作的开展作出了不小的贡献,实践经验的积累也为今后理论研究奠定了一定的基础。

    探索创新和快速发展时期(1979年至今)

    在党的十一届三中全会春风的吹拂下,我国迎来了思想的解放、经济的发展、政治的昌明、教育的勃兴、科学的春天,作为教育事业重要组成部分的学校体育工作也逐步走上了健康发展的轨道。伴随着教育改革的不断深入,关于学校体育评价理论的研究也步入了改革创新和快速发展时期,取得了丰硕的成果。

    1第一阶段(1979-2001年)

    这一阶段以1979年教育部等四部委联合召开的扬州会议为主要标志。伴随着改革的进程,学校体育评价理论研究工作也得到了广泛的开展,取得了一些成果,形成了一定理论积累。1975年原国家体委公布的《国家体育锻炼标准》(后经1982年和1990两次修改)、1990年原国家教委颁布《普通高等学校教育评估暂行规定》和国务院1999年颁布的《中共中央国务院关于深化教育改革全面推进素质教育的决定》为学校体育评价理论研究工作提供了指导。

    1.1主要研究成就

    体育测量与评价的研究有所发展,起步较早的是广州体育学院的陈骏良。1982年广州体育学院受教育部的委托,举办了“体育测量”的学习班和学术讨论会。广州体育学院《体育测量与评价》教学小组在陈骏良的主持下,收集、分析研究国外研究成果的基础上,提出了《体育测量与评价》较为完整的内容体系表。该教学小组还结合我国体育师资培养的现实需要,分析了我国体育院系开设《体育测量与评价》课程的意义,提出了在我国如何开展该课程的具体设想,为形成我国自己的《体育测量与评价》奠定了基础。

    产生了一些有较高学习和应用价值的专着。较早的研究成果是邢文华等1983年编着出版的《中小学生体质测定与评价》和1985年出版的《体育测量与评价》;1987年赵秋蓉等编着的《体育测量评价》出版;1987年陈骏良主编,国内第一本经国家教委审定的《体育测量学基础》教材出版,1991年其又编译了《体育测量与评价》,把国外学校先进的体育评价理论引进到了我国,对我国这方面的研究提供了参考;1995年全国体育学院教材委员会编着了《体育测量评价》,成为我国体育院系学生的正式教材,为我国培养学校体育评价理论研究和实践人才作出了巨大贡献。

    这一阶段研究领域逐渐扩大,涉及到学生、教师活动、学校体育管理等多个方面;评价方法的研究得到重视,对学生评价的具体步骤和方法已有较详细的设计,有数十位专家学者设计了各种评价指标体系和具体的评价方法;模糊数学评判法受到了广泛的关注;提出了目标评价模式,华东师范大学的张争鸣认为“要进行学校体育评价,必须探讨如何制定合理的、可行的、可测的、可靠的学校体育目标体系。”他同时提出了“必须以定性描述为基础,采用定性评价与定量评价相结合”的观点,这些观点至今仍是我国教育评价理论和实践研究的重点。

    1.2研究特点该阶段评价方法研究较多,对于学校体育在实践

    中应采取什么类型的评价形式研究较少。譬如应采取相对评价还是绝对评价,抑或是个体内差异评价;对学生、教师应采用过程性评价还是终结性评价,这方面的基础理论研究明显不足。仅有刘永东、王剑君提出“体育成绩的评定应着眼于教学开始与结束时成绩的变化上,利用进步分评价体育成绩不仅可能,而且必要”。

    他们建立了进步分评价常模,并建议采取个体内差异形式对学生进行评价。这一阶段关于学校体育评价的研究取得了很多有价值的成果,其中对学校体育评价理论的发展进行了有意的探索,对当时高校体育工作起到了极大的促进作用。但随着研究的深入,有些学者已经注意到有些观念和具体评价方法已不能适应现代教育的发展要求,譬如林永森就对当时的体育效果评价提出了“身体素质检测不确定性、赋值评价分值安排难求合理和评价体系忽视了课外活动的内容”3个方面的质疑,并提出了建立合理体育效果评价的新思路。

    2第二阶段(2002年至今)

    2002年教育部制定了《全国普通高等学校体育课程教学指导纲要》,确定体育课程评价包括对学生的学习、教师的教学和课程建设等3个方面,并分别就这3个方面的评价内容给予了原则性规定。同年又颁布了《教育部关于积极推进中小学评价与考试制度改革的通知》,对中小学评价与考试制度改革的原则做了详细的规定。

    2.1主要研究成就

    产生了一些新的学校体育评价理论,研究更加全面和深入。李建军编着的《新课程的学校体育评价》以“体育与健康课程评价”为主要研究内容,明确提出了发展性和“主体取向”的学校体育评价思想,为我国学校体育评价研究提供了新的思路。姚蕾和杨铁黎所着《中小学体育教学评价的基本理论与实践》关注了学生体育态度的评价,认为“通过对体育态度的测量,可以检验体育教学大纲的内容和教学方法对学生情感究竟有什么样的影响,为改进体育教学方法,提高教学效果提供较为客观的理论依据。”并对学生体育态度评价的具体方法进行了分析。

    四川大学体育学院的张超慧等编着的《学校体育评价》不仅对学校体育评价从理论上进行了深入的分析,而且介绍了评价实践的一些具体方法。对元评价的研究受到重视,建立了一定的元评价量化分析模型。金红珍在分析教学评价元评价的内涵和意义基础上提出了体育教学评价信度和效度的量化分析模型。杨军等人所着《学校体育评价理论与实践》一书,不仅对国内外关于学校体育评价现状进行了阐述,确立了学校体育评价的理论基础,并且对学校评价、体育教师评价和学生评价方法进行了详细的分析。

    这一阶段的研究把统计学、数学模型、心理学等其他学科知识应用到学校体育评价中来,出现了一些对国外学校体育评价的研究成果。张建华、杨铁黎、殷恒婵通过对美、日两国体育教学评价的改革和发展现状的比较研究,了解到国外体育教学评价的共同发展趋势是“重视过程性评价和个性评价、评价内容多元化、评价方法和工具多样化、强调定性与定量化评价相结合”,对我国体育教学评价改革有重要的启示作用。

    该阶段提出了发展性评价理论,有不少学者对自我评价、形成性评价、多元评价体系进行了理论研究,并构建了多种评价指标体系,如张京生等人在2002至2003运用发展性评价理论进行了体育学习行为和效果的跟踪试验,验证了发展性评价对学生体育学习与学习效果的积极影响。杨军、闫建华等人在发展性评价理论基础上把质性评价引入体育教师评价,构建了质性评价和量化评价相结合的多元主体参与的体育教师业务能力评价体系,使评价更全面,更有利于教师的专业发展和业务能力的提高。

    2.2研究特点

    高校体育评价研究更加深入,关于中小学校体育评价也受到重视。伴随着基础教育课程改革的深入和推广以及国家对中小学评价制度改革提出的要求,这一时期关于中小学体育评价的研究热情空前的高涨,产生了大量有影响的研究成果。

    研究领域更加广泛,涉及到了学生体育学习行为和态度、体育考核、课余训练及学校体育工作的各个方面,对体育教师综合素质的评价研究受到了关注。

    开始对现行评价体系进行反思和改革,随着教育评价理论的发展和“健康第一”思想的提出,过去学校体育评价理论中的一些观点和方法已不再适应时代的要求,不少学者在研究先进评价理论的基础上,分析了我国过去学校体育评价体系的不足,提出了一些好的改革意见,构建了不少新的评价体系。如陈玉清、李汉超从“以人为本”理念的角度,对高校公共体育课的教学评价进行了研究,提出了更新观念、建立创新评价体系的思路和建议。

    反思与展望

教育测量评价论文篇(8)

高中语文人教版“表达与交流”模块对高中写作教学无疑具有指挥棒的作用。由五本课本中“表达与交流”内容编排的分析,我们可以看出教材注重什么淡化什么。具体为必修一:心音共鸣――写触动心灵的人和事,亲近自然――写景要抓住特征,人性光辉――写人要凸显个性,黄河九曲――写事要有点波澜。必修二:直面挫折学习描写,美的发现学习抒情,想象世界学习虚构。必修三:多思善想――学习选取理论的角度,学会宽容――学习选择和使用论据,善待生命――学习论证,爱的奉献――学习议论中的记叙。必修四:解读时间――学习横向展开议论,发现幸福――学习纵向展开议论,确立自信――学习反驳,善于思辨――学习辩证分析。必修五:缘事析理,学习写得深刻;讴歌亲情,学习写得充实;锤炼思想,学习写得有文采;注重创新,学习写得新颖。

不管从标题上,还是从篇目内容及课后练习上,认真分析比较,我们都可以归纳出“表达与交流”的三大内容:一谈如何写好记叙,描写,抒情,议论,二谈“虚构”与真实,侧重虚构,三谈好文章的四项指标――深刻、充实、文采、新颖。没有涉及它们与文体的相关,更没有涉及文体的理论知识与实际操作指导。必修教材的“表达与交流”忠实地执行了我国《语文课程标准》的要求。我国《语文课程标准》并不特别强调文体,小学以叙述文为主;初中有明确的文体要求:“写记叙文,做到内容具体;写简单的说明文,做到明白清楚;写简单的议论文,努力做到有理有据;根据生活需要,写日常应用文。”普通高中只要求综合运用记叙、说明、描写、议论和抒情等表达方式,并没有明确的文体规定。这反映出《语文课程标准》淡化文体意识的价值取向。

美国高中作文教学却与我们不同,文体教学在美国高中作文教学中有着重要地位,在作文教学的几大模块中占有相当大的比重。

如在作文教学纲要和指导观念里,实用文体的写作训练和写作基本能力训练与表达方式的训练共同组成美国的写作教学的三大内容。这三大训练有多种训练体系,有单向的也有综合的。“文体”意识和实际指导在这些体系中随处可见,如“思维―表达训练体系”主要进行思维和文体写作的训练,其他还有一般文体写作训练体系、实用文体写作训练体系。如美国加利福尼亚州的《公立学校英语课程标准》明确要求学生写叙述文、文学评论、研究报告、劝说文、技术性文章及常用应用文,对每一文体都有明确规定。

在实际教学操作中,文体教学得到了同样的重视。

如三册《美国语文》(2004年同心出版社出版的《美国语文―――美国著名中学课文精选》,以下简称《美国语文》)是中国大陆第一套系统引进的西方著名中学语文教材。文体类型(除编译时由于篇幅关系删去的戏剧、诗歌外)统计如下:

文体类型具体类型举例:

(1)小说:短篇小说、科幻小说、长篇小说;

(2)散文:分析散文、讽刺散文、说明散文、思考性散文;

(3)其他类:日志、神话、传说、故事、叙述文、布道、自传、劝说文、演讲、格言、书信、通告、游记、回忆录等。

课后写作练习文体训练类型举例:

(1)想象、娱乐、感受类:神话、短篇小说、科幻小说、电影情景、人物传记、日记、续写、改写、广告、网页制作、格言等;

(2)通告、阐释、描述类:通信、通告、新闻报道、报告、描述性信件、摘要、讣告、课程描述、竞赛公告等;

(3)劝说、建议、说明类:说服性的短文、给校长的建议、建议专栏、收藏者指南、提议、有说服力的信条等;

(4)分析、评论类:文学分析、社论、批判性回应、说服力评价、比较研究等。

与淡化文体教学对应的是中国作文评价标准是面向文学性、诗意和哲理性很强的记叙文、议论文、说明文的通用标准;与注重文体训练对应的是美国评价标准鲜明地体现为分文体定标准。这种分文体制订评价标准的做法是较为严谨的。它能充分反映评价学生驾驭不同文体的能力,较之抽象地评价内容充实否、结构完整否、符合要求的“通用”标准否,更能起到实际的评分指导与规范作用。

我认为美国作文教学对文体教学的重视,是美国作文教学卓有成效的原因之一。在美国教学中最令全球教育界惊奇的事就是美国人普遍具有良好的写作能力,只要受过普通教育的美国人,都能把自己要说的话写在纸上且表达清楚,同时尽可能遣词造句,使意义更准确。而这种情况,反映的正是美国高中作文评价有相当高的效度。

美国作文教学之所以卓有成效,注重文体教学和注重效标效度的分文体制订评价标准的作文评价功不可没。这样的结论不是主观臆测,而是通过客观分析得出的。了解美国文体教学与分文体制订评价标准的作文评价,并对评价效度进行分析,我国作文评价的效度问题亟待解决。

怎么改进甚至改革高中作文教学呢?作文成绩与写作能力是否成正比呢?

举个比较绝对的例子,假如高中作文教学只有新诗教学,作文练习与测评题只有新诗形式的测评题,有这么一个可能结果,老师抱怨作文难教,学生抱怨作文难学难写、没东西可写、太多束缚不自由……还有一个可能结果是,作文测评成绩不错的高中毕业生在社会上不会写读书笔记,不会写文学评论,不会写报告,不会写社论,不会写计划书,不会写基本的商业策划,不会写比赛公告……作文测评成绩不好的高中毕业生在社会上却成了新兴作家或者公司的文案高手……于是作文教学改革呼声四起,兴起了半命题写诗、话题写诗、材料写诗、漫画写诗、不定题材写诗、生活化写诗、心灵化写诗、学生诗作互评、多就少改诗、总评诗、面评诗、每日一诗……

当然,上述是一个较为绝对的例子,可事实是,这个绝对例子与当下高中作文教学内容的关系只不过是五十步与百步的差别。高中作文教学中并未有更多样的文体介绍和指导,在大部分学生的脑海中,他们知道的文体就只有文学性质的记叙文、散文、论点论据论证式议论文、诗歌和戏剧,就在这有限的三四个文体中选择,较之于事实上丰富多样的文体而言,“文体不限”能算是真正意义上的文体不限么?脑海中根本就没有多少文体概念知识,何谈文体不限的选择呢?在记叙文、散文、论点论据论证式议论文、诗歌和戏剧范围内分文体定标准的作文评价是否是真正意义上的分文体定标准作文评价呢?如前文所示美国中学文体训练类型涵盖了工作岗位上大部分的文体写作,培养了美国人而不是美国学生普遍良好的写作能力,而大部分接受过高中作文教学的中国高中毕业生,在进行工作岗位上基本的文案写作时一般都是初次接触,能力匮乏。这不仅是高中语文作文教学中文体教学缺失造成的后果,还反映了对应于淡化文体教学的淡化文体评价的作文评价的低效度。

任何测评都涉及效度。效度是指所测量到的结果反映所想要考察内容的程度,测量结果与要考察的内容越吻合,则效度越高;反之,则效度越低。在作文教学中或者在升学考试中指作文测评的分数反映学生作文真实能力的程度。在判断作文测评是否有效性时,在考虑到测评的内容效度的同时还必须考虑到效标效度。

内容效度最容易理解,它关心的是测量的内容。比如某一个学段进行诗歌写作教学,内容效度就会考察诗歌写作测题是不是与这个学段教授的诗歌写作知识、方法和技能有正相关。

效标效度稍微复杂些,是指当前一项测验结果与作为效标的资料或数量之间的相关程度。效度的高与低,需要有一定的参照点加以考查,尤其是能力的测试。实际上能力都是无法测量的,因此我们只能确定一个或几个能反映能力的标准,然后做间接的比较。这种人为确定的效度标准简称“效标”。效标效度关心的是测量结果和另外一个效标(criterion)的符合程度。比如,据说微软公司招人的时候会考一些类似脑筋急转弯的问题,像“纽约有多少个水井盖”之类。考察者并不真的关心答题者是不是真的知道纽约有多少个水井盖,他关心的是答题者以后的工作业绩(相当于效标)。那么考题到底能在多大程度上预测工作业绩呢,或者说这些考题和工作业绩的相关程度到底如何呢,这就是效标效度。比如,在美国高中作文教学进行的同时,进行多种文体的训练与测评,这个测评,除了关心测评题与教学内容的相关程度外,更关心学生实际生活和工作中的写作能力及发展。测题到底能在多大程度上预测写作能力呢?或者说这些测题与日后的写作能力的相关程度到底如何呢?这就是效标效度。

内容效度和效标效度的区别首先是调查者(investigator)的观察的取向(orientation)不同。使用内容效度的调查者,关心的是测量的得分。比如教师对学生进行写作测验,那么学生在这张试卷上的得分正是教师所关心的。使用效标效度的调查者,他关心的是效标的得分。比如上面举的招聘的例子,公司并不真正在乎你在招聘试题上的得分,他在乎的是你以后的工作业绩(相当于效标),上面举的作文测评的例子,教师还关心学生在以后的生活和工作中的写作能力(相当于效标)。

这是两种效度在观察重心上的区别,另一个明显的区别就是推论(inference)的程度的不同。对使用内容效度的测量者来说,基本上不存在推论。还以作文测题为例,作文成绩高分就说明这学生作文能力好,教师不需要进行推论,作文成绩得分直接说明问题(如果要引申到学生的学习态度就是在进行推论了)。在效标效度的例子里,推论是很明显的。招聘试题上的得分真的能预测将来的工作业绩吗,诗歌写作成绩好真的能预测将来生活和工作中的写作能力吗?局限于记叙文、散文、小说、论点论据论证式议论文和诗歌的写作成绩好,真的能预测将来的写作能力吗?这时候推论的意味已经很强烈了,实际上效标效度就是用来衡量这种推论的可靠性的。

测量者关心的是测量得分时,用内容效度;测量者关心的是效标得分时,用效标效度,也许还需要解释一下,这两种效度并非只能用于不同的作文测题,而是取决于测量者如何使用作文测题。比如,同样是一套或一系列作文测题,两种效度都可以用来考核它,这取决于施测者如何使用这套或者一系列作文测题。如果施测者只想从中知道学生对相关的写作知识和能力的掌握情况,那么他应该关心这套或这个系列作文测题的内容效度如何;如果施测者想以此推断学生将来工作生活中的写作能力,那么他应该关心这套或者这个系列的写作测题的效标效度如何。

在关注效标效度时,不能忽略了同时效度和预测效度。它们是在时间上对效标效度进行的分类。它们的区别是时间上不同,同时效度的效标和原测量工具是同时施测的,而预测效度的效标是在原测量工具之后施测的。比如学习期间正式进行的作文写作测验的同时效度的效标是与这些测验并行的学生写作练习成绩和老师观察评价等,而预测效度的效标则可以是期末考作文成绩,高考作文成绩和生活工作中的写作能力。

前文已经说道,效标效度的使用者真正关心的是效标上的结果,因而待检验的测量工具其实是作为效标的替代物出现的。为什么要使用替代物呢?其理由在预测效度这里很明显,效标是作用于将来的,我现在要知道结果就必须使用替代物。比如要知道学生在将来正式高考时的可能成绩,那么我们需要使用有较高的预测效度的模拟试卷。又或者要知道学生将来写研究报告的能力,那么教学时应该使用有较高的预测性的作文测题;这两个例子里的模拟试卷和写作测题都是为了实现预测的目的而必须使用的替代性的测量工具。

结合以上关于内容效度和效标效度的分析,我国作文教学和作文评价的现状如下:高中作文教学模块“表达与交流”有三大内容:一谈如何写好记叙,描写,抒情,议论,二谈“虚构”与真实,侧重虚构,三谈好文章的四项指标――深刻,充实,文采,新颖。作文评价对应于这三大内容的评价标准。那么从理论上说作文评价已有了较高的内容效度。可是内容效度高并不代表作文评价的效度高,并不能真实反映作文教学的成效如何,是否科学合理。在作文教学中,文体教学的严重缺失,文体意识严重匮乏导致学生日后生活中自由写作思维极为狭隘,没有可供自由选择的文体写作,驾驭文体能力相当乏弱导致学生日后无法快速应对丰富多样的文体写作,这反映了我国高中作文教学评价相当低的效标效度。

事实上,高中毕业后大部分人都有这样的经验,开始社会生活、走上工作岗位后,没有多少人会继续进行我国高中作文类型的写作,例如写文学性、诗意、哲理性很强的记叙文、散文、议论文,反而是当下高中作文教学所淡化的形式规范性很严格而且思维能力要求各具特色的其他文体写作特别是实用文体写作成了很多人的日常写作,可是在作文评价过程中,忽视对效标效度的分析,并没有把驾驭这些文体的写作能力当做预测效标来分析和重视。缺少这种效标效度分析的作文评价就无法发现当下作文教学成效低微,学生应对生活与工作的实际写作能力低弱的真正原因。

参考文献:

[1]黄全愈.高考招生制度改革的追问[J].全球教育展望,2005(5).

[2]陈文中.外国大学入学作文考试的启示[J].中学语文教学,2004(4).

[3]周鸾飞.近五年我国高中教学作文评价的研究[J].湖南师范大学硕士学位论文,2009.5.

[4]贺义廉.高考备考作文训练的现状与误区[J].当代教育论坛,2008第5期.

[5]王选遨.构建符合课程标准要求的写作教学新思路[J].语文教学通讯高中版,2005(3)

[6]朱晓斌.西方写作教学研究的新进展[J].心理科学,2001,VOL24(4).

[7]张娟.我国高考作文命题及评价回归生活的诉求[J].教育测量与评价,2008.9.

[8]黄全愈.“高考”在美国[M].广西师范大学出版社.

[9]瞿宝奎.教育学文集・教育评价[M].人民教育出版社,1989.

教育测量评价论文篇(9)

新的历史时期使高校爱国主义教育面临新的挑战,出现新的问题,这就对新时期高校的爱国主义教育提出了新的更高要求,赋予其新的内容与时代特征。为了适应这种新挑战,解决出现的新问题,爱国主义教育者必须首先解放自己的思想、实事求是,变革已经不能很好地适应当今时代特征和实践要求的传统爱国主义思想观念,结合“90后”大学生爱国主义教育面临的新问题和传统教育的经验,树立爱国主义教育的新理念,明确爱国主义教育的原则,既要积极有效地探索加强“90后”大学生爱国主义教育的方法和途径,又迫切需要建立科学、全面、公正的爱国主义教育监测与评价模式进行保驾护航。

一、建立监测与评价模式的意义

(一)建立监测与评价模式是高校加强和改进“90后”大学生爱国主义教育的需要。爱国主义教育是一项具有战略意义的基础性工程。它是基础,是面向全社会、全民族、全国人民的教育,是提高民族素质和加强社会主义物质文明和精神文明建设的基础性工程。爱国主义能极大地调动全民族的力量,增强民族凝聚力,形成全民族的最大合力,推动社会主义现代化建设;爱国主义能够激发每一个人的爱国热情,唤起人们和祖国同呼吸共命运的爱国情怀,使人们为祖国取得的每一个重要成就感到欢欣鼓舞,为国家碰到的灾难和人民受到的损害而伤心忧虑。我国党和政府长期以来都十分关注大学生爱国主义教育工作,推出了一系列举措,各高校也相应地采取了一定措施,对爱国主义教育进行监测的过程,实质上是推动高校提高爱国主义教育质量和效率的过程。

(二)建立监测与评价模式是弥补爱国主义教育不足的需要。我国高校长期以来在爱国主义教育方面偏重于在课堂上对学生的正面灌输教育和日常生活中的严格管理,只关注教师在教学方面的质量如何和学生考试的成绩高低。单纯的衡量标准虽然对教学质量起到了促进作用,但是对于爱国主义教育的真实效果如何却没有一个完善的监测与评价标准。因此建立爱国主义教育的监测与评价模式是促进爱国主义教育全面发展的必然。

(三)建立监测与评价模式是“90后”大学生特点的必然要求。从当前的情况来看,一是“90后”大学生对待爱国主义教育存在模糊性,对待爱国主义教育在态度上存在偏差;二是“90后”大学生的多元性特征导致其爱国主义价值取向削弱,良好的成长经历导致其爱国主义意识淡薄;三是大学爱国主义教育存在着内容缺乏时代性,理论缺乏创新,教育对象缺乏连续性、长期性和针对性,教育方法直接且过于单调等问题。“90后”大学生本身处在一个思想不断发展成熟的时期,承受巨大的学业、心理和就业压力,极易受到外来思想的侵蚀,这就更加迫切需要加强以爱国主义为核心的民族精神和以改革创新为核心的时代精神教育。也迫切需要建立爱国主义教育的监测与评价模式推动高校改革原有的爱国主义教育体系,使之更好地适应“90后”大学生的需要。

二、构建监测与评价模式的原则

(一)坚持社会主义原则。思想政治教育工作需完全服从于政党和阶级的需要,体现了政党和阶级利益。因此在对爱国主义教育进行的监测和评价的过程中要按照无产阶级的立场、观点、方法和党的社会主义初级阶段基本路线对照爱国主义教育工作,坚持用科学的、发展的眼光制定相应的监测和评价模式,同时应结合90后大学生中存在的错误思潮进行批判,帮助学生树立正确的爱国主义思想。

(二)坚持实事求是的原则。新时期的大学生对于新思想、新事物的接受能力非常快,爱国主义教育工作也不能脱离实际情况,要做到理论联系实际。同样作为爱国主义教育重要一环的监测与评价工作也要坚持实事求是的原则,掌握实际情况,了解实际效果,作出实事求是的判断和分析。其根本是为了实实在在地推进爱国主义教育工作,使其能取得显著的效果。

(三)坚持针对性的原则。高校爱国主义教育的监测和评价必须针对爱国主义教育的目标和要求,无论对爱国主义教育的内容、方法还是实现途径,以及实际效果都要契合爱国主义教育的根本目的。此外,由于“90后”大学生的不同特点,要充分考虑到他们不同的成长环境、不同的思想状况和不同的文化背景,同时他们的接受能力和思考能力也已大大超过前人。因此,要始终坚持以学生为本,在进行监测与评价的时候要根据不同层次的学生制定不同的标准,不能以偏概全、以点概面。

(四)坚持系统性原则。高校爱国主义教育的过程是一个规范的系统性过程,这就决定了高校爱国主义教育的监测与评价具有突出的系统性特征。它要求高校爱国主义教育的监测与评价工作立足于全面把握,从整体上真实反映学校爱国主义教育的基本情况与成效。同时要求学校内部各行政机构、教学、教辅部门及各基层院系都明确责任,层次分明,管理有序,各部门做到分工明确,协同合作,做到各个环节紧密相连,环环紧扣,形成爱国主义教育的合力,充分发挥教育、管理这两大要素在爱国主义教育这一系统工作中的巨大作用。

(五)坚持动态性的原则。建立爱国主义的监测与评价模式一方面要充分继承和发扬我国监测公正、评价客观的优良传统,同时充分汲取国外在此领域内的先进经验和优秀的成果,把它们和我国高校爱国主义教育的实际相结合。另一方面时代的发展及互联网的普及应用使爱国主义教育处于不断发展和完善的过程,其教育效果也是一个逐步显现和不断强化的过程,这就决定了爱国主义教育的监测与评价的内容、方式方法要经常性地根据客观条件和具体情况的变化而变化。只有坚持这种动态的变化才能准确及时地反映出高校爱国主义教育的变化和发展。

三、监测与评价模式的运行

(一)明确组织领导机构。设立校级领导机构,建议各高校党委成立由校领导为主要负责人,教务处、学生工作部等部门负责同志,以及各二级学院分管学生工作的党委(总支)书记共同参与的一个直属于高校党委领导的爱国主义教育监测与评价领导小组,负责全校的爱国主义教育监测与评估工作。具体由教务处主导教学监测系统和教学评估系统,校学生工作部主导管理监测系统和管理评估系统,相关职能部门和各二级学院一起协助做好管理监测和评估系统。此外还应建立健全机构的相关管理制度和绩效考核标准。

(二)进行逐阶分级式的监测与评价。“90后”大学生的爱国主义教育是一个具有高度整体性和系统性的工作,它需要学校党委、行政把它作为一个全局性的问题进行考虑和布局,它不是某一个部门或者某一位老师能够组织和实施的。高校应结合“90后”大学生的特点,构建具有现代爱国主义教育特色的监测与评价体系。该体系分为两个主系统,分别是教育系统和管理系统。

1.教育系统。由学校教务处主导,相关的职能部门例如教学设备处、现代教育中心、评估中心等教辅部门协助管理,下设教育监测系统和教学评价系统。其监测与评估的内容主要包括两方面:一是施教者的主体状况,包括他们的政治素质、人格素质和理论修养;二是受教者个人的思想品德情况及受教群体的思想品德的状况。目前各高校的教育评价系统已经相对比较完善,国家也专门进行本科教学水平合格(审核)评估促进高校不断改进教学,完善教学评估。对于教学监测系统,主要包括教学前的准备监测、教学过程监测和教学效果监测与信息反馈三部分职能,由于目前高校职能部门人手有限,往往对于教学监测都是通过教案检查、督导组听课、学生评教等方式进行。

2.管理系统。由校学生工作部主导,相关职能部门例如团委、招生就业处等部门协助管理,下设管理监测系统和管理评价系统。管理监测系统主要通过二级学院进行,以各学院的学生科、团总支为基础,通过辅导员和学生组织对党团组织活动开展情况,学生会和学生社团开展活动情况,校园文化建设情况,以及社会实践活动开展情况进行监测。管理评价系统则通过学生对辅导员和班主任的测评、对学生活动的参与程度、对学生干部的拥护程度等方面进行评价。

3.两个主系统的地位与关系。在系统论的构建原理下,教育系统和管理系统都处于同等重要的地位。学生爱国主义教育监测与评价领导小组可以通过构建这两个系统对学生的理论、实践及评价进行有机整合,两个主系统下的子系统一旦出现问题就可以及时得到协调和解决。

四、监测与评价的结果反馈

对爱国主义教育工作进行监测和评价的最终落脚点是增强爱国主义教育的效果。因此将监测和评价的最终结果对监测和评价的主体和客体进行反馈,促进他们不断进步显得尤为重要。监测和评价必须有结果,不能有头无尾,只有过程,没有结论。如果只有监测和评价的过程而没有结果的反馈,那么整个监测与评价体系的构建也就失去了意义。

对于监测与评价的结果,应当采用恰当的方式表现出来。可以采用评语、等级、数量或者综合以上的表现方式。但是无论采用哪种方式都必须把结果反馈给被评价单位和被评价者。反馈的过程中应当注意方式和方法,可以采用集体讲评、个别谈话的方式,一方面保护了被评价者的隐私,另一方面实现了反馈过程中的思想沟通。在整个反馈中应以表扬为主,批评为辅,重要的不是将被评价人一棒子打死,而是让他通过评价反馈找出不足,寻求解决之道。最终把爱国主义教育的工作提高到新的水平。

爱国主义教育的监测与评价是一个系统的工程,可以对爱国主义教育的效果作出更加真实可信的结论,对于帮助和改善高校“90后”大学生爱国主义教育工作具有非常重要的理论意义和现实意义,值得更多的思想政治教育者关注和研究。

参考文献:

[1]梁建桃.高校大学生健康教育实施监测与评价的研究[J].武汉体育学院学报,2007(9).

教育测量评价论文篇(10)

中图分类号:G641 文献标志码:A 文章编号:1002-2589(2012)33-0289-02

思想政治教育的检测评估,是根据教育目的的要求,运用一定的评估指标和评估方法,检查和评定教育效果的教育环节。思想政治教育作为一种实践活动,它要服从和服务于党的中心工作,满足社会主义的经济、政治、文化建设发展的需要,为培养有理想、有道德、有知识、有纪律的一代新人作贡献,这就是思想政治教育的社会价值。因此,构建科学、完整的思想政治教育的检查评估体系,已成为新时期思想政治教育不容忽视的重要任务。

一、思想政治教育检测评估体系的意义

思想政治教育的价值,是通过思想政治教育的实际效果体现出来的。而实际效果的好坏和大小,反映了教育价值的取向和程度。思想政治教育的检测评估从教育的实际效果入手进行,它的意义主要有以下几方面。

1.检测评估不仅对教育效果进行正确合理判断,而且对教育效果产生积极作用

教育有什么样的效果,有多大的效果,有什么成绩和经验,有什么失误和教训,有关这些利弊得失的问题,只能通过检测评估才能加以判定。教育的成绩与失误分不清,经验与教训辨不明,就无法认定教育的效果和价值。同时检测评估对教育效果的判断,还有评价的作用。对教育的成绩,经验的肯定性评价,能够有效巩固、拓展、深化教育成果,激励受评对象参加教育活动的积极性和创造性,促进受教育者提高思想道德素质的主动性和自觉性。而对教育的失误,教训的否定性评价,也能够有效制止、克服教育的不良后果,激发受评对象吸取教训,避免重犯错误,争取成功。

2.检测评估是客观评估教育者工作成果,且不断提高其教育质量的重要途径

长久以来,很多人认为思想政治教育是虚的、空的,政治教育与业务工作存在“两张皮”现象屡见不鲜,究其原因,就是对思想政治教育缺乏行之有效的监测评估。一般来说,教育的效果反映了教育者的教育水平和教育态度。对教育过程和教育效果的检测评估,有助于思想政治教育者进行自我检查,对自己有一个客观的自我认识、评价和对自己所从事的工作有一个正确的态度,能够对自己进一步端正教育态度,改进教育内容和方法,增强其对思想政治教育的事业心和责任感,并使之转化为工作的积极性和主动性,从而不断提高教育质量。

3.检测评估是领导者加强和改进教育工作的重要措施

对于思想政治教育过程,我们认为是思想政治教育信息传输、加工、处理和反馈的过程,其中反馈这个环节起着重要的作用。而思想政治教育评估作为思想政治教育系统反馈的一种重要形式,能够对思想政治教育的效果进行衡量和判断。通过思想政治教育检测评估,思想政治教育的领导部门能够了解自己输出的信息作用于下属部门后产生的结果,从而对思想政治教育信息的再输出进行调整。可见,检测评估是领导者认识教育的有利条件,即发现薄弱环节,掌握教育工作新情况和新问题,并为新的教育决策提供实际材料,为进一步加强和改进教育工作创造条件。

二、思想政治教育检测评估体系的基本原则

1.方向性原则

方向性原则是决定并保证思想政治教育检测评估活动的性质的准则,它要求我们坚持正确的指导思想,明确检测目的,指导和制约检测评估活动的方向。它要求思想政治教育检测评估必须以以教育目标为根据,确保思想政治教育检测评估的正确导向。要正确处理好方向目标与达度目标的关系。方向目标是达度目标的基础,达度目标是方向目标的具体化。两者是本源关系,不能颠倒。具体体现在学生思想政治教育目标中,党的教育方针是方向目标,具体操作指标是达度目标。若本末倒置,无视教育方针贯彻与否,只就操行而论操行,则势必会在培养什么人的问题上出现错误导向。

2.客观性原则

客观性原则是依据马克思主义实事求是的思想路线规范其检测评估活动的基本准则。它要求在进行思想政治教育检测评估时,应坚持实事求是的态度,排斥主观臆想,真实全面地反映出思想政治教育的效果。由于思想政治教育量化有一定难度,在进行评估的时候难免会有主观印象的成分存在。所以为了评估的公平、公正性,评估者应该一切从实际出发,做到实事求是地反映情况。

3.全面性原则

全面性原则是依据辩证唯物主义的基本原理规范其评估活动的基本准则。它要求在进行思想政治教育检测评估时,对思想政治教育的所有方面都进行评估,避免以偏概全。在其检测评估活动的具体实践中,既要坚持检测评估标准的全面性,又要检测评估因素的全面性。贯彻全面性检测评估原则要把握思想政治教育效果的整体性和关联性。不但从物质和精神两个方面的结合中来评估教育效果。而且在思想政治教育的检测评估中,全面考察评估对象原本的思想与表现。既要看现实的效果,又要注重潜在的发展。

4.实效性原则

对思想政治教育的检测评估,最重要的是看它的实际效果。而教育的实际效果,要通过多方面的因素综合表现出来。按照这些因素,可以确立两个必须遵循的原则,即知行统一原则和德才兼备原则。

三、思想政治教育检测评估的困境

我们知道,思想政治教育检查评估体系的建立和实施作为思想政治教育的重要环节,一直被高校重视。随着思想政治教育评估的实践发展,虽然思想政治教育评估理论得到了充分的发展,但由于思想政治教育本身的特点,思想政治教育评估仍面临众多的困境。这是急需解决的问题。

1.评估范围的不确定性

在高校中,教育者思想政治教育工作的主要目标就是对受教育者进行思想政治品德培育,而看这项工作是否有效的标准就是看受教育者的品德培育状况。但是对于评估的范围,评估者可能存在许多不同的意见,例如对教育部门的评估我们既可以理解为对操作部门的评估,但从评估的目的上来看,更要注意对教育主管部门的评估,因为主管部门才是最终的决策者。另一方面,思想政治教育工作者由于受到主客观条件的限制,很难通过了解受教育者的言行来深入分析其真实的思想状况。思想政治品德通常是在一定环境与氛围下才能表现出来,若是没有这样的条件,品德很难转化为实际行动力。评估往往具有随意性,在开展和实施评估检查工作时,大部分都是人为地确定评估的时间和活动内容。评估的随意性往往并不完全符合高校思想政治教育活动的内在规律,因此给思想政治教育检查评估体系的建立和实施带来了难以确定的影响和困难。

2.思想政治教育背景环境的复杂性

思想政治教育是具体的实践活动,这一活动无论是从宏观方面还是微观方面说,它开展的前提、基础与条件具体到每一受教育者都有很大的差异,造成差异的原因又各有不同。所以在执行起来难度较大。因此我们还是要具体问题具体分析,检查评估体系的对象内容应该是多方面的结合,可能是静止的文字,或者是受教育者的实际行动,而结合的难点在于度的把握。

3.评估的技术或方法问题

思想政治教育评估中以什么作为衡量保准,这是目前评估理论的难点。在方法论上,有人提出,可以参考企业的无形资产进行评估的方法来评估思想政治教育的效果?这是一个可以引起讨论的话题,两者都具有“无形”的特征,既然前者可以进行评估,那么后者也应可以评估。现在的问题是:企业的无形资产评估,其最终的显示指标金额数,对思想政治教育评估,是否也应归于钱的评价上,这是非常可疑的。尽管金钱作为衡量价值,具有广泛的普遍性,但有许多活动领域的社会评估不会作为最终衡量标准,有很多东西不能直接用金钱来衡量。因此,有关评估的技术或方法之间的问题,应该仔细研究。

四、思想政治教育检测评估发展的探索

鉴于思想政治教育评估目前的发展状况,思想政治教育问题亟待解决。应该根据思想政治教育评估的原则,针对检测评估的困境,做好以下工作。

1.确立思想政治教育检测评估的新目标

思想政治教育是作为一项斗争的工具而被正式确立的。然而,随着经济全球化与信息全球化的到来,它应保持相对独立的意识形态。当前社会倡导建立了以重大权益为核心的价值评价体系,这一切都和思想政治教育的价值追求相背离。思想政治教育任务发生了变化,在今天关键是要促进和谐社会的形成。在这种情况下,必须确立思想政治教育检测评估的新目标。关注思想政治教育中的人文精神,做到以人为本。

2.把握好构建思想政治教育检测评估体系的背景和依据

思想政治教育评价体系必须建立在一定的政治背景之下,必须有它科学的理论和政策的基础,既要符合新时代的要求和形势发展的需要,又要符合大学的办学方向,同时符合党和国家的政策和有关文件精神,符合社会主义事业的建设者和接班人的价值要求。因此,思想政治教育检查评价体系的建立不能脱离社会主义发展的时代背景,不能脱离党的基本路线、方针和政策。

3.评估方法实行定量分析与定性分析相结合

一般来说,由于定量分析方法的运用过程与结果都是可以检验的,具有可操作性,其结果相对可靠,因此把这种分析方法运用于思想政治教育检查评估工作中,可以减少结果的随意性。相对于定性分析的主观性其优势较大。但是由于定量分析无法对思想政治教育评估工作进行整合,所以我们应将两者结合起来进行研究,将其融合在一起。

参考文献:

[1]李生峰.构建高校思想政治教育评估督导机制的意义[J].高教论坛,2010,(9).

上一篇: 乡镇环保站工作计划 下一篇: 社团会议总结
相关精选
相关期刊