教育测评概念汇总十篇

时间:2023-08-16 17:29:03

教育测评概念

教育测评概念篇(1)

提要 本文针对教育评价相关关系不清的总是从多角度对此进行了辨析,并对教育评价学科群的建设,提出了许多有益的建议。

关键词 教育测验 教育测量 教育评价

作者 刘尧 浙江师范大学教科所副研究员(金华 321004)

教育评估、教育评价是20世纪30年代在美国兴起,60 年代兴盛于西方世界并传入我国。这些学科虽然在我国大力发展已有20余年,但理论

研究的进展不大,学科的成熟度不高,与我国广泛开展的教育评价活动很不适应.我国各省市都有考试院(中心),也成立了许多评估、评价机构,广泛展开了对教育测评估评价活动。而与此相应的教育测验、教育统计、教育测量、教育评估、教育评价理论很不成熟.尤其值得重视的是教育评价与教育研究和发展,以及对教育评价实践的指导.鉴于此,本文对与教育评价相关概念进行简述和辨析.

一.关于教育评价相关概念简述

教育测验:即为考试,它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统,它由主考、

被考(考生)、试卷(试题的集合及其评分标准)、考分四要素组成。考试的过程就是主考组织编制试题,通过试题作用于被考,将正确答案、评分标准与被考的反应(答案)相比较,然后给出考分的过程。考试从宏观上可分为社会考试和教育考试两大类。教育考试又可分为校内考试和校外考试两类。按考试分数的解释与使用,可分为常模参照性考试和标准参照性考试。按考试对象分,有学业的成就考试、学术能力倾向测验(其目的在于测量考生学习的潜在能力、发展倾向,如音乐能力倾向测量)、人格测验(如测量态度、兴趣、情绪、性格等).按测验人数分,有个别测验、团体测量.接测验方式分,有纸笔测验(用笔时试卷作答)和非纸笔测验(如口试、实验操作、表演等)。其它可分为难度测验、速度测验、总结性测验、诊断性测验以及大规模测验(其成绩的使用有权威性,要求严格,标准化程度高)、教师自编测验(即教师自编用于课堂教学的测验)等.[1]

教育统计(学):运用数理统计学的原理和方法研究教育现象中的数量关系的一门应用学科。它通过数据的分析和处理,准确地掌握教育

情况,为制定教育方针、政策提供科学依据,为开展教育科学研究,探索教育规律,制定教育方案,检查教育效率提供科学方法,也为教育管理和教育评价提供有效的工具.它分为两大类:一是描述统计学,研究简缩数据和描述这些数据,二是推断统计学,用数据进行统计检验,统计分析和非参数统计法作出决策。前者只是分析某一样本的特点,而后者则是通过抽取母体的一个样本,并以此样本为根据来分析母体的特点.它是在教育问题的研究中,描述样本,分析样本,分析样本与总体的关系,从而进行教育科学推论的一种原理和方法.其研究方法一般有:大量观察法、统计分组法、综合指标计算法、统计资料检验法、统计资料图示等。[2]

教育测量(学):研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

手段和数理统计方法等数学工具,根据教育目标或教学计划的要求,研究如何测量和评价教育效果,如何编制测量计划,各种类型试题的优缺点,衡量一个学业成绩测验好坏的数量指标,如何进行测验结果的统计分析,测验分数的解释和评价等.其主要内容包括:测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验的常模、测验的实施和评分、测验结果的解释等。[3]

教育评估:是一种有系统地去寻找并搜集资料,对评估对象作预测性、估计性的评判,以便协助教育决策者从若干种可行的策略中择一而

行的过程.在我国教育评估与教育评价不作严格区别,在实践中具体运用时,不同的范围和场合有不同的习惯用法.如高等教育中多用评估,在督导部门也称督导评估,而在普通教育领域多用教育评价不过两个概念是有一定区别的.评估有估价的含义,较为模糊粗略,而评价相对而言是较为精确的价值判断,评估多用于群体或单位的状态及效果的估价,而评价则既有对群体和单位的价值判断,也有对个人的判断.教育评估的一个重要目的就是为教育决策提供重要依据,国家教育管理部门要根据教育评估的结果,及时调整教育的决策。教育评估的结果对国家、对学校都是一份咨询材料,而不是行动纲领.[4]

教育评价(学):以教育为对象,研究各类教育目标与相应的教育现象之间的关系,并给予一定的价值判断的学科.它的研究范围可划分

为:宏观教育评价(研究教育思想评价和教育制度评价)和微观教育评价(研究学校教育系统内部各类教育思想和教育活动的评价,如学校办学思想、学校领导管理质量、教师教育和教学质量、学生德智体全面发展质量的评价等)。它的基本范畴是:教育评价的对象,教育评价的范围,教育评价的模式,教育质的规定性评价,教育量的规定性的评价,教育质和量变化的度的评价,教育评价的指标体系,教育评价的类型.其研究的基本原则有:客观性原则、理论联系实际原则、发展性原则和联系性原则.其种类包括目标评价、过程评价、条件评价、贡献评价等.[5]

教育评价(学):教育评论学是研究教育评论现象和教育评论活动规律的科学.或者说它是研究教育评论的历史、现状,教育评论现象的

本质联系,教育评论工作的性质、任务和作用,以及教育评论工作的原则、方法的科学.教育评论学是与教育理论、教育史并列的一门教育学科.要建立教育评论学的学科体系,必须解决两大难题,即建立教育评论学的范畴体系和概念体系,并给予科学的揭示和阐述,使这些概念和范畴形成一个有机整体.同时,还要运用这些概念、范畴及其所固有的内在联系,采取科学的方法论证教育评论活动中最普通、最一般的科学原理;从而揭示出整个教育评论活动及其形成和发展的基本规律。教育评论学的研究对象和任务,从根本上规定了教育评论学的学科性质和范畴.首先,教育评论活动是一种教育科研活动,它的直接结果是鉴别、评判教育文化的优劣,进而对教育界产生社会舆论导向作用;而教育文化本身及其所产生的依附于受教育者身心的精神产品,都属于意识形态范畴,可见教育评论家属于研究意识形态和揭示教育评论活动的本质规律,建立完整的教育评论学学科体系。所以,教育评论学也属于基础理论学科。再次,教育评论学的研究对象决定了教育评论学涉及整个教育领域,内涵十分丰富。也可从不同视角,针对不同范畴建立多部门、多层次的分支学科(如:教育理论评论学、教育史评论学、教育行政评论学、教育家评论学等),所以教育评论学又是一门综合性的学科[6]

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系:教育测验是对人的知识、技能和能力以及其他某些心理特征的检测,是教育评价的一种手段,确切地说它是

教育评价获得评价信息的工具之一.教育评价获取信息的测验法就是来自于教育测验.

教育评价与教育统计的关系:教育统计是运用数理统计的原理和方法研究教育现象中的数量关系,通过数据的分析和处理确切地掌握教育

情况,也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系:教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

定,为教育评价提供依据,是教育评价信息的主要来源.如果没有教育测量提供的资料,教育评价将成为无源之水,失去了作价值判断的依据,其科学性、准确性便无从谈起。另外,教育测量的结果只有通过教育评价才能获得实际意义,成为改进教育工作有参考价值的信息.[7]

教育评价与教育评估的关系:教育评价与教育评估是非常相近的两个概念,在许多场合是通用的。评价是精确的价值判断;而评估是估计

的、预测性的价值判断。在我国从政府的文件到学者的文章论著,以及教育实践都把评估与评价混用。我个人倾向于把教育评估的对象限定在以宏观、中观的复杂教育系统的战略性、预测性估价方面,对于微观的较简单的教育系统的过去和现存实态则作为教育评价的对象。

教育评价与教育评论的关系:教育评论是对教育文化的反思和展望,它的对象是以教育文化中的精神文化和制度文化为主的,以真善美作

为评论标准的观念活动。严格讲它与教育评价虽只一字之差,但它与教育评价分属于教育科学的不同领域,有着重大区别。比如,教育评价是一种管理活动,而教育评论则为观念活动;教育评价由评价机构按严密的程序实施,而教育评论则由教育评论家个人采用灵活多样的方式方法评述;教育评价有明确的指标体系并要求量化,而教育评论无需指标体系更不用量化,教育评价的对象是具体的可控的,而教育评论的对象是抽象的,不可控的;教育评价的结果多用于改进工作,而教育评论的结果则多用于改变观念;等等。这不是说教育评价与教育评论一点关系都没有,它们的关系表现在教育评价的结果可以成为教育评论的论据影响教育评论,而教育评论的结果可以作为教育思想观念影响教育评价所依据的教育价值观。

三、从价值论角度看与教育评价相关概念的区别

唯物主义的价值论认为,价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

区别。事实判断是以客体的本质和规律为对象的,它探讨客体“是怎样的“、”是什么“,探讨事物的现象、本质和规律等实体属性,即以理性认识这种抽象思维形式反映客体的本质及其规律。而价值判断是以客体与主体需要的关系为对象,它探讨客体的价值属性,即客体的社会意义------对社会需要意味着什么,它以多种意识形式-----认识(价值与事实判断)、情感(对价值的态度体验)、意志(对价值的自觉保证)等诸种形式的综合来反映客体与主体需要的关系。

从前面的分析可以看出,教育评价对评价的对象不仅要借助教育测验、教育统计、教育测量进行量的测定和分析,而且要进行质的分析,

把所有考查绩效的材料和分析综合起来,在多大程度上达到了预期的目的作出价值判断。从这里可以看出,教青评价行为是建立在事实判断基础上的价值判断.教育评价中的事实判断在于诊断与鉴别教育的性状,价值判断则是对诊断鉴别而得的结果或结论,按其价值取向进行合乎目的的推断和判断;事实判断是价值判断的基础,价值判断是事实判断的目的性追求。而教育评论是依据一定的教育价值观和教育价值取向,对教育的一种价值判断。从教育测验到教育评论是一个由事实判断向价值判断的变化过程,我们不能说教育测验丝毫没有价值判断,如在测验什么不测验什么的问题上是有价值判断的;同样,我们也不能说教育评论就无点滴的事实判断,教育评论需要通过事实判断的真凭实据作论据。

四、对教育评价学及其学科群研究的建议

教育评价学经过几十年的发展已初步形成了学科体系,尽管概念、体系有待完善,但已为下一步的研究打下了坚实的基础。与此相应的考

试学(研究教育测验的学科)、教育统计学、教育测量学、教育评估学、教育评论学都已有相应的发展,形成了一个共生的教育评价学科群。21世纪,要使这个学科群得到良好的发展,我认为首先对各个学科的研究范围有个明确的划分,尤其是对教育评价学要有合理的定位,不要再把考试学、教育统计学、教育测量学的内容纳入自己的努力范围,要让它们以独立的学科更好地为教育评价学服务。另外,教育评价学还要把属于教育精神文化、制度文化类的抽象的,教育评价无力评价的范围还给教育评论学,让教育评论学更快地发展.同时,要把教育评估与教育评价的关系处理好,可将两者合二为一,形成统一的学科.其次,各学科要明确自己的研究对象,形成概念体系和学科体系,把一些已成熟的概念和理论约定俗成稳定下来,逐步形成相对稳定的学科知识和概念体系。第三,要处理好理论与实践的关系,加强理论研究,使其适应实践的要求,要积极总结实践经验并升华为新的理论,丰富和发展教育评价学学科体系.第四,要处理好引进与消化吸收的关系问题。无论是从国外引进的教育评价学理论,还是从教育科学界以外引人教育的评价理论都要结合我国的教育理论和教育实践,进行修正使其“本土化”和“教育化”。

综上所述,搞清教育评价相关概念的关系,对理清教育评价学科群内各学科的关系,促进该学科群的发展,为丰富和发展教育科学,加快

教育测评概念篇(2)

教育评估、教育评价是20世纪30年代在美国兴起,60 年代兴盛于西方世界并传入我国。这些学科虽然在我国大力发展已有20余年,但理论

研究的进展不大,学科的成熟度不高,与我国广泛开展的教育评价活动很不适应.我国各省市都有考试院(中心),也成立了许多评估、评价机构,广泛展开了对教育测评估评价活动。而与此相应的教育测验、教育统计、教育测量、教育评估、教育评价理论很不成熟.尤其值得重视的是教育评价与教育研究和发展,以及对教育评价实践的指导.鉴于此,本文对与教育评价相关概念进行简述和辨析.

一.关于教育评价相关概念简述

教育测验:即为考试,它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统,它由主考、

被考(考生)、试卷(试题的集合及其评分标准)、考分四要素组成。考试的过程就是主考组织编制试题,通过试题作用于被考,将正确答案、评分标准与被考的反应(答案)相比较,然后给出考分的过程。考试从宏观上可分为社会考试和教育考试两大类。教育考试又可分为校内考试和校外考试两类。按考试分数的解释与使用,可分为常模参照性考试和标准参照性考试。按考试对象分,有学业的成就考试、学术能力倾向测验(其目的在于测量考生学习的潜在能力、发展倾向,如音乐能力倾向测量)、人格测验(如测量态度、兴趣、情绪、性格等).按测验人数分,有个别测验、团体测量.接测验方式分,有纸笔测验(用笔时试卷作答)和非纸笔测验(如口试、实验操作、表演等)。其它可分为难度测验、速度测验、总结性测验、诊断性测验以及大规模测验(其成绩的使用有权威性,要求严格,标准化程度高)、教师自编测验(即教师自编用于课堂教学的测验)等.[1]

教育统计(学):运用数理统计学的原理和方法研究教育现象中的数量关系的一门应用学科。它通过数据的分析和处理,准确地掌握教育

情况,为制定教育方针、政策提供科学依据,为开展教育科学研究,探索教育规律,制定教育方案,检查教育效率提供科学方法,也为教育管理和教育评价提供有效的工具.它分为两大类:一是描述统计学,研究简缩数据和描述这些数据,二是推断统计学,用数据进行统计检验,统计分析和非参数统计法作出决策。前者只是分析某一样本的特点,而后者则是通过抽取母体的一个样本,并以此样本为根据来分析母体的特点.它是在教育问题的研究中,描述样本,分析样本,分析样本与总体的关系,从而进行教育科学推论的一种原理和方法.其研究方法一般有:大量观察法、统计分组法、综合指标计算法、统计资料检验法、统计资料图示等。[2]

教育测量(学):研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

手段和数理统计方法等数学工具,根据教育目标或教学计划的要求,研究如何测量和评价教育效果,如何编制测量计划,各种类型试题的优缺点,衡量一个学业成绩测验好坏的数量指标,如何进行测验结果的统计分析,测验分数的解释和评价等.其主要内容包括:测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验的常模、测验的实施和评分、测验结果的解释等。[3]

教育评估:是一种有系统地去寻找并搜集资料,对评估对象作预测性、估计性的评判,以便协助教育决策者从若干种可行的策略中择一而

行的过程.在我国教育评估与教育评价不作严格区别,在实践中具体运用时,不同的范围和场合有不同的习惯用法.如高等教育中多用评估,在督导部门也称督导评估,而在普通教育领域多用教育评价不过两个概念是有一定区别的.评估有估价的含义,较为模糊粗略,而评价相对而言是较为精确的价值判断,评估多用于群体或单位的状态及效果的估价,而评价则既有对群体和单位的价值判断,也有对个人的判断.教育评估的一个重要目的就是为教育决策提供重要依据,国家教育管理部门要根据教育评估的结果,及时调整教育的决策。教育评估的结果对国家、对学校都是一份咨询材料,而不是行动纲领.[4]

教育评价(学):以教育为对象,研究各类教育目标与相应的教育现象之间的关系,并给予一定的价值判断的学科.它的研究范围可划分

为:宏观教育评价(研究教育思想评价和教育制度评价)和微观教育评价(研究学校教育系统内部各类教育思想和教育活动的评价,如学校办学思想、学校领导管理质量、教师教育和教学质量、学生德智体全面发展质量的评价等)。它的基本范畴是:教育评价的对象,教育评价的范围,教育评价的模式,教育质的规定性评价,教育量的规定性的评价,教育质和量变化的度的评价,教育评价的指标体系,教育评价的类型.其研究的基本原则有:客观性原则、理论联系实际原则、发展性原则和联系性原则.其种类包括目标评价、过程评价、条件评价、贡献评价等.[5]

教育评价(学):教育评论学是研究教育评论现象和教育评论活动规律的科学.或者说它是研究教育评论的历史、现状,教育评论现象的

本质联系,教育评论工作的性质、任务和作用,以及教育评论工作的原则、方法的科学.教育评论学是与教育理论、教育史并列的一门教育学科.要建立教育评论学的学科体系,必须解决两大难题,即建立教育评论学的范畴体系和概念体系,并给予科学的揭示和阐述,使这些概念和范畴形成一个有机整体.同时,还要运用这些概念、范畴及其所固有的内在联系,采取科学的方法论证教育评论活动中最普通、最一般的科学原理;从而揭示出整个教育评论活动及其形成和发展的基本规律。教育评论学的研究对象和任务,从根本上规定了教育评论学的学科性质和范畴.首先,教育评论活动是一种教育科研活动,它的直接结果是鉴别、评判教育文化的优劣,进而对教育界产生社会舆论导向作用;而教育文化本身及其所产生的依附于受教育者身心的精神产品,都属于意识形态范畴,可见教育评论家属于研究意识形态和揭示教育评论活动的本质规律,建立完整的教育评论学学科体系。所以,教育评论学也属于基础理论学科。再次,教育评论学的研究对象决定了教育评论学涉及整个教育领域,内涵十分丰富。也可从不同视角,针对不同范畴建立多部门、多层次的分支学科(如:教育理论评论学、教育史评论学、教育行政评论学、教育家评论学等),所以教育评论学又是一门综合性的学科[6]

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系:教育测验是对人的知识、技能和能力以及其他某些心理特征的检测,是教育评价的一种手段,确切地说它是

教育评价获得评价信息的工具之一.教育评价获取信息的测验法就是来自于教育测验.

教育评价与教育统计的关系:教育统计是运用数理统计的原理和方法研究教育现象中的数量关系,通过数据的分析和处理确切地掌握教育

情况,也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系:教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

定,为教育评价提供依据,是教育评价信息的主要来源.如果没有教育测量提供的资料,教育评价将成为无源之水,失去了作价值判断的依据,其科学性、准确性便无从谈起。另外,教育测量的结果只有通过教育评价才能获得实际意义,成为改进教育工作有参考价值的信息.[7]

教育评价与教育评估的关系:教育评价与教育评估是非常相近的两个概念,在许多场合是通用的。评价是精确的价值判断;而评估是估计

的、预测性的价值判断。在我国从政府的文件到学者的文章论著,以及教育实践都把评估与评价混用。我个人倾向于把教育评估的对象限定在以宏观、中观的复杂教育系统的战略性、预测性估价方面,对于微观的较简单的教育系统的过去和现存实态则作为教育评价的对象。

教育评价与教育评论的关系:教育评论是对教育文化的反思和展望,它的对象是以教育文化中的精神文化和制度文化为主的,以真善美作

为评论标准的观念活动。严格讲它与教育评价虽只一字之差,但它与教育评价分属于教育科学的不同领域,有着重大区别。比如,教育评价是一种管理活动,而教育评论则为观念活动;教育评价由评价机构按严密的程序实施,而教育评论则由教育评论家个人采用灵活多样的方式方法评述;教育评价有明确的指标体系并要求量化,而教育评论无需指标体系更不用量化,教育评价的对象是具体的可控的,而教育评论的对象是抽象的,不可控的;教育评价的结果多用于改进工作,而教育评论的结果则多用于改变观念;等等。这不是说教育评价与教育评论一点关系都没有,它们的关系表现在教育评价的结果可以成为教育评论的论据影响教育评论,而教育评论的结果可以作为教育思想观念影响教育评价所依据的教育价值观。

三、从价值论角度看与教育评价相关概念的区别

唯物主义的价值论认为,价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

区别。事实判断是以客体的本质和规律为对象的,它探讨客体“是怎样的“、”是什么“,探讨事物的现象、本质和规律等实体属性,即以理性认识这种抽象思维形式反映客体的本质及其规律。而价值判断是以客体与主体需要的关系为对象,它探讨客体的价值属性,即客体的社会意义------对社会需要意味着什么,它以多种意识形式-----认识(价值与事实判断)、情感(对价值的态度体验)、意志(对价值的自觉保证)等诸种形式的综合来反映客体与主体需要的关系。

从前面的分析可以看出,教育评价对评价的对象不仅要借助教育测验、教育统计、教育测量进行量的测定和分析,而且要进行质的分析,

把所有考查绩效的材料和分析综合起来,在多大程度上达到了预期的目的作出价值判断。从这里可以看出,教青评价行为是建立在事实判断基础上的价值判断.教育评价中的事实判断在于诊断与鉴别教育的性状,价值判断则是对诊断鉴别而得的结果或结论,按其价值取向进行合乎目的的推断和判断;事实判断是价值判断的基础,价值判断是事实判断的目的性追求。而教育评论是依据一定的教育价值观和教育价值取向,对教育的一种价值判断。从教育测验到教育评论是一个由事实判断向价值判断的变化过程,我们不能说教育测验丝毫没有价值判断,如在测验什么不测验什么的问题上是有价值判断的;同样,我们也不能说教育评论就无点滴的事实判断,教育评论需要通过事实判断的真凭实据作论据。

四、对教育评价学及其学科群研究的建议

教育评价学经过几十年的发展已初步形成了学科体系,尽管概念、体系有待完善,但已为下一步的研究打下了坚实的基础。与此相应的考

试学(研究教育测验的学科)、教育统计学、教育测量学、教育评估学、教育评论学都已有相应的发展,形成了一个共生的教育评价学科群。21世纪,要使这个学科群得到良好的发展,我认为首先对各个学科的研究范围有个明确的划分,尤其是对教育评价学要有合理的定位,不要再把考试学、教育统计学、教育测量学的内容纳入自己的努力范围,要让它们以独立的学科更好地为教育评价学服务。另外,教育评价学还要把属于教育精神文化、制度文化类的抽象的,教育评价无力评价的范围还给教育评论学,让教育评论学更快地发展.同时,要把教育评估与教育评价的关系处理好,可将两者合二为一,形成统一的学科.其次,各学科要明确自己的研究对象,形成概念体系和学科体系,把一些已成熟的概念和理论约定俗成稳定下来,逐步形成相对稳定的学科知识和概念体系。第三,要处理好理论与实践的关系,加强理论研究,使其适应实践的要求,要积极总结实践经验并升华为新的理论,丰富和发展教育评价学学科体系.第四,要处理好引进与消化吸收的关系问题。无论是从国外引进的教育评价学理论,还是从教育科学界以外引人教育的评价理论都要结合我国的教育理论和教育实践,进行修正使其“本土化”和“教育化”。

综上所述,搞清教育评价相关概念的关系,对理清教育评价学科群内各学科的关系,促进该学科群的发展,为丰富和发展教育科学,加快

教育事业的发展有重大的理论和实践意义。

参考文献

[1] [5]见李冀主编·《教育管理辞典》(第二版)·海南出版社·1997年版·第216页、第167页

[2] 参见曹延亭编著·《教育统计学基础》·辽宁人民出版社·1984年版·第2--5页

[3] 见李冀主编·《教育管理辞典》(第二版)·海南出版社·1997年版·第216页

[4] 参见许茂祖编著·《高等教育评估理论与方法》·中国铁道出版社·1997年版·第16--27页

教育测评概念篇(3)

一.关于教育评价相关概念简述

教育测验:即为考试,它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统,它由主考、

被考(考生)、试卷(试题的集合及其评分标准)、考分四要素组成。考试的过程就是主考组织编制试题,通过试题作用于被考,将正确答案、评分标准与被考的反应(答案)相比较,然后给出考分的过程。考试从宏观上可分为社会考试和教育考试两大类。教育考试又可分为校内考试和校外考试两类。按考试分数的解释与使用,可分为常模参照性考试和标准参照性考试。按考试对象分,有学业的成就考试、学术能力倾向测验(其目的在于测量考生学习的潜在能力、发展倾向,如音乐能力倾向测量)、人格测验(如测量态度、兴趣、情绪、性格等).按测验人数分,有个别测验、团体测量.接测验方式分,有纸笔测验(用笔时试卷作答)和非纸笔测验(如口试、实验操作、表演等)。其它可分为难度测验、速度测验、总结性测验、诊断性测验以及大规模测验(其成绩的使用有权威性,要求严格,标准化程度高)、教师自编测验(即教师自编用于课堂教学的测验)等.[1]

教育统计(学):运用数理统计学的原理和方法研究教育现象中的数量关系的一门应用学科。它通过数据的分析和处理,准确地掌握教育

情况,为制定教育方针、政策提供科学依据,为开展教育科学研究,探索教育规律,制定教育方案,检查教育效率提供科学方法,也为教育管理和教育评价提供有效的工具.它分为两大类:一是描述统计学,研究简缩数据和描述这些数据,二是推断统计学,用数据进行统计检验,统计分析和非参数统计法作出决策。前者只是分析某一样本的特点,而后者则是通过抽取母体的一个样本,并以此样本为根据来分析母体的特点.它是在教育问题的研究中,描述样本,分析样本,分析样本与总体的关系,从而进行教育科学推论的一种原理和方法.其研究方法一般有:大量观察法、统计分组法、综合指标计算法、统计资料检验法、统计资料图示等。[2]

教育测量(学):研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

手段和数理统计方法等数学工具,根据教育目标或教学计划的要求,研究如何测量和评价教育效果,如何编制测量计划,各种类型试题的优缺点,衡量一个学业成绩测验好坏的数量指标,如何进行测验结果的统计分析,测验分数的解释和评价等.其主要内容包括:测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验的常模、测验的实施和评分、测验结果的解释等。[3]

教育评估:是一种有系统地去寻找并搜集资料,对评估对象作预测性、估计性的评判,以便协助教育决策者从若干种可行的策略中择一而

行的过程.在我国教育评估与教育评价不作严格区别,在实践中具体运用时,不同的范围和场合有不同的习惯用法.如高等教育中多用评估,在督导部门也称督导评估,而在普通教育领域多用教育评价不过两个概念是有一定区别的.评估有估价的含义,较为模糊粗略,而评价相对而言是较为精确的价值判断,评估多用于群体或单位的状态及效果的估价,而评价则既有对群体和单位的价值判断,也有对个人的判断.教育评估的一个重要目的就是为教育决策提供重要依据,国家教育管理部门要根据教育评估的结果,及时调整教育的决策。教育评估的结果对国家、对学校都是一份咨询材料,而不是行动纲领.[4]

教育评价(学):以教育为对象,研究各类教育目标与相应的教育现象之间的关系,并给予一定的价值判断的学科.它的研究范围可划分

为:宏观教育评价(研究教育思想评价和教育制度评价)和微观教育评价(研究学校教育系统内部各类教育思想和教育活动的评价,如学校办学思想、学校领导管理质量、教师教育和教学质量、学生德智体全面发展质量的评价等)。它的基本范畴是:教育评价的对象,教育评价的范围,教育评价的模式,教育质的规定性评价,教育量的规定性的评价,教育质和量变化的度的评价,教育评价的指标体系,教育评价的类型.其研究的基本原则有:客观性原则、理论联系实际原则、发展性原则和联系性原则.其种类包括目标评价、过程评价、条件评价、贡献评价等.[5]

教育评价(学):教育评论学是研究教育评论现象和教育评论活动规律的科学.或者说它是研究教育评论的历史、现状,教育评论现象的

本质联系,教育评论工作的性质、任务和作用,以及教育评论工作的原则、方法的科学.教育评论学是与教育理论、教育史并列的一门教育学科.要建立教育评论学的学科体系,必须解决两大难题,即建立教育评论学的范畴体系和概念体系,并给予科学的揭示和阐述,使这些概念和范畴形成一个有机整体.同时,还要运用这些概念、范畴及其所固有的内在联系,采取科学的方法论证教育评论活动中最普通、最一般的科学原理;从而揭示出整个教育评论活动及其形成和发展的基本规律。教育评论学的研究对象和任务,从根本上规定了教育评论学的学科性质和范畴.首先,教育评论活动是一种教育科研活动,它的直接结果是鉴别、评判教育文化的优劣,进而对教育界产生社会舆论导向作用;而教育文化本身及其所产生的依附于受教育者身心的精神产品,都属于馐缎翁冻耄杉逃缆奂沂粲谘芯恳馐缎翁徒沂窘逃缆刍疃谋局使媛桑⑼暾慕逃缆垩аЭ铺逑怠K裕逃缆垩б彩粲诨±砺垩Э啤T俅危逃缆垩У难芯慷韵缶龆私逃缆垩婕罢鼋逃煊颍诤址岣弧R部纱硬煌咏牵攵圆煌冻虢⒍嗖棵拧⒍嗖愦蔚姆种аЭ疲ㄈ纾航逃砺燮缆垩А⒔逃菲缆垩А⒔逃姓缆垩А⒔逃移缆垩У龋越逃缆垩в质且幻抛酆闲缘难Э芠6]

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系:教育测验是对人的知识、技能和能力以及其他某些心理特征的检测,是教育评价的一种手段,确切地说它是

教育评价获得评价信息的工具之一.教育评价获取信息的测验法就是来自于教育测验.

教育评价与教育统计的关系:教育统计是运用数理统计的原理和方法研究教育现象中的数量关系,通过数据的分析和处理确切地掌握教育

情况,也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系:教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

定,为教育评价提供依据,是教育评价信息的主要来源.如果没有教育测量提供的资料,教育评价将成为无源之水,失去了作价值判断的依据,其科学性、准确性便无从谈起。另外,教育测量的结果只有通过教育评价才能获得实际意义,成为改进教育工作有参考价值的信息.[7]

教育评价与教育评估的关系:教育评价与教育评估是非常相近的两个概念,在许多场合是通用的。评价是精确的价值判断;而评估是估计

的、预测性的价值判断。在我国从政府的文件到学者的文章论著,以及教育实践都把评估与评价混用。我个人倾向于把教育评估的对象限定在以宏观、中观的复杂教育系统的战略性、预测性估价方面,对于微观的较简单的教育系统的过去和现存实态则作为教育评价的对象。

教育评价与教育评论的关系:教育评论是对教育文化的反思和展望,它的对象是以教育文化中的精神文化和制度文化为主的,以真善美作

为评论标准的观念活动。严格讲它与教育评价虽只一字之差,但它与教育评价分属于教育科学的不同领域,有着重大区别。比如,教育评价是一种管理活动,而教育评论则为观念活动;教育评价由评价机构按严密的程序实施,而教育评论则由教育评论家个人采用灵活多样的方式方法评述;教育评价有明确的指标体系并要求量化,而教育评论无需指标体系更不用量化,教育评价的对象是具体的可控的,而教育评论的对象是抽象的,不可控的;教育评价的结果多用于改进工作,而教育评论的结果则多用于改变观念;等等。这不是说教育评价与教育评论一点关系都没有,它们的关系表现在教育评价的结果可以成为教育评论的论据影响教育评论,而教育评论的结果可以作为教育思想观念影响教育评价所依据的教育价值观。

三、从价值论角度看与教育评价相关概念的区别

唯物主义的价值论认为,价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

教育测评概念篇(4)

    (一)具有鲜明的时代特征的“素养”

    “素养”一词的最初含义是“能读会写的能力”,随着时代的发展,其内涵发生了深刻的变化。素养已经从最初一系列彼此孤立的技能组合(如简单的识字、算术)拓展为一种支持个体可持续发展的关键能力,素养的获取和应用方式强调情境适应性,它也逐步被视为个体持续性发展的动态过程而非静态结果。

    PISA的“素养”概念正是在这样一种背景下产生,因此它具有鲜明的时代特征。

    首先“素养”是基础领域的基本知识和能力。PISA不是选拔性的考试,它希望了解的是在正常情况下个体所呈现的真实状态。因此,PISA的测评领域是阅读、数学和科学这三个最主要的学科,PISA考察的知识和能力是个体发展和社会适应所需要的最基础、最关键的部分。

    其次,“素养”综合而非单一。PISA并不孤立地看待每个测评领域的知识,而是力图把知识与反思及实际应用的能力联系在一起,并强调过程的掌握、概念的理解,以及在不同情境中的作用的能力。另一方面,PISA也非常重视跨学科的能力,在PISA 2003和PISA 2012中,广义的问题解决能力也是测评的重要内容。此外,PISA素养不仅包含知识和技能等认知领域的内容,还提出要纳入动机、策略的非认知内容。

    “素养”反映的是个体适应社会要求的功能性特征。“素养”与社会期许紧密相关。从PISA阅读评价来看,它不仅强调阅读者能够理解所读文章的内容意义,还要强调阅读者通过阅读获取知识信息,以此满足自身需求,并有效参与社会。换句话说,PISA的关注点不是停留在工具导向的阅读能力上(识字、理解与书写简单的句子),而是在此基础上的通过能力的运用来达成个体发展、社会适应的目标。

    (二)PISA“素养”是一个不断发展和完善的概念

    尽管PISA的素养概念在提出时已经相对完整,并具有相当的前瞻性特征,但社会的发展,特别是技术革新的日新月异,人们对未来社会理解,对究竟何种能力、哪些领域更为重要的判断不断发生着改变。同时,随着PISA测评本身的发展,人们对于学校教育的理解也在不断加深。在这种双重作用下,素养概念必须通过不断发展变化才能保持其前瞻性特征。

    那么,从2000年以来,PISA的素养发生了哪些变化?其发展的路径是什么呢?这是本文力图回答的问题。

    二、PISA素养概念的发展

    (一)逐步纳入非认知因素和元认知因素

    尽管学习动机因素和方法策略包含在PISA素养的最初概念中,但对它们的深入理解和重视程度则经历了整个PISA的发展过程。

    PISA 2000中对于引入态度和参与评价做了这样的解释:一项综合评价在教育方面“一个国家做得怎样”的测试,必须在注意传统的学校科目表现的同时,也关注广义的教育产出。因此,PISA 2000调查了15岁学生对阅读和数学的态度,以及他们对学习和学校教育的更广义上的参与(Engagement)。①这说明,作为一种区别于传统知识技能的学校教育成就,态度和参与从最初就获得了PISA足够的重视。这里所谓的非认知因素,包括动机、态度、兴趣、自信心、学习参与。非认知因素之外,学习策略和对学习的管理也作为另一种区别于传统学校教育的成果列入考查范围。尽管这两类因素被视为学校教育的重要成果,但它们还是更多地被看作影响学生学习的因素。

    PISA 2003基本沿用了PISA 2000的理解。认为应当在考虑学业成绩的同时,也要考虑认知的、情绪的和态度的方面,但对非认知因素的梳理进一步清晰。它认为学校教育的非认知成果主要包括学生的动机、参与、对自身能力的信念。②在对参与的理解上,基本将其视为动机同义,即包含内源动机(如兴趣爱好)和外源动机(如升学或工作前途)。

    PISA 2006的主要测试领域为科学。科学的学习不像阅读和数学,它与个体对科学的动机和态度具有更为紧密的相关。因此,态度被视为个体科学素养的关键内容,其中包括科学方面的信念、动机和自我效能感。PISA 2006详细考察了与科学相关的态度方面,包括对科学探究的支持(support for scientific enquiry)、作为科学学习者的自我信念(self-belief as science learners)、对科学的兴趣(interest in science)、对资源和环境的责任感(responsible towards resources and environment),③这些因素总体上可以反映出学生参与科学学习和探索的程度。因此,科学学习的非认知因素从一开始就是作为素养的重要内容出现的。

    动机因素和元认知因素在学习中的作用一直受到研究者的重视,自2000年以来的研究逐步发展出较完善的元认知因素测量方法。④在此基础上,PISA 2009首次提出“阅读素养中的动机和行为因素”,⑤这明显区别于PISA 2000阅读素养中对动机和元认知因素的定位,明确了动机因素和元认知因素在PISA阅读素养中的重要地位。

    综上可见,PISA素养在重视知识、技能及知识技能运用传统的基础上,逐步将动机、态度、自信等非认知因素以及学习策略、学习控制等因素纳入到素养的概念中。这促进了对素养概念的不断深入和完善。

    (二)跨学科的“问题解决能力”

    学校教育均主要通过分科目的教育来实现,然而,受教育者离开学校教育情境后,需要面对的则是一个各种因素综合在一起,必须综合运用各种学科知识解决实际问题的世界。因此,实际的问题解决能力一直受到教育界的关注。问题解决能力能不能测量,该如何测量?问题解决的过程包括哪些阶段,是否存在某种范式?这些问题一直困扰着教育研究者。作为一项跨学科的测试,PISA关注知识和技能在现实情境中的运用能力,并力图涵盖除传统学校教育成果之外的内容,比如上述的非认知因素和元认知因素。因此,问题解决能力的测评也成为了PISA重点关注的领域。

    PIS A 2003首次运用纸笔测试的方法对“问题解决能力”领域进行测量。问题解决能力被界定为在解决方法不明显,可能运用到的素养或学科领域不仅限于单一的阅读、数学和科学的情况下,个人运用认知过程(cognitive process)来面对和解决真实的、跨学科的问题情境的能力。该定义强调问题情境的真实、解决方法的非常规和学科之间的跨越。基于这种理解,PISA认为问题解决测评应该从问题类型、问题情境、解决过程三个维度来组织。并且对问题解决过程进行了更为详细的分析,认为其中应包含理解问题、理清关系、表征问题、解决问题、检查结果和结果表述六个环节。可见,PISA对问题解决进行了科学的分解,并使其具有可操作性,这保证了测试结果的效度。

    在PISA 2003的基础上,PISA 2012即将再一次测评问题解决能力,并且将采用计算机化的测评方式。这能大大促进问题解决测评的信效度,接下来一部分会进行具体分析。

    问题解决能力所具有的综合性、真实性和非常规性明显不同于传统基于学科领域测评的素养,通过纳入这一领域,PISA的素养测评的领域得到进一步扩展。

    (三)突破传统纸笔测试素养的“计算机化测评素养”

    信息社会对人的基本素养提出了新的挑战。据国际电联(ICU)的统计,全球使用网络的人口从2005年至2010年翻了近一番,每百人中比例达到29.7%。⑥计算机和互联网的使用深刻改变了人们的生活、学习和工作方式。人们面临着加速变化的知识、“知识型工作者”要求的提高和信息通信技术大量融入工作领域的现实。这导致了对人的“素养”的重新思考,也对长期注重纸质媒介的学校教育提出了新的要求。顺应这种趋势,PISA从2009年起开始引入电子阅读测试(ERA)。在PISA 2012测评框架中又进一步加入了计算机化测评的数学、科学内容,并将这三者总称为“基于计算机测评的素养”(CBAL)。同时,问题解决能力(PS)测试在PISA 2012也采用计算机测试。

    基于计算机的测评不仅是测试形式的改变,其测评的内容和能力种类也与纸笔测试不同。以阅读素养为例,计算化测评的阅读文本突破了纸笔测试的二维呈现方式,将众多内容上存在某种关联的信息链接在一起,以网页的形式呈现。从文本类型上看,它既包含连续文本,也包括非连续文本,还包括各种混排文本;从呈现方式上看,既有图文描述,也可纳入多媒体内容,既有单一页面,也有包含大量链接页面;从交互性上看,既有单向呈现,也有双向互动。在网络情境下获取信息要求个体能够迅速浏览大量的材料并及时判断信息的可信性,阅读素养中的批判思维能力变得更加重要(Halpern, 1989; Shetzer & Warschauer, 2000; Warschauer, 1999)。⑦因此,计算机化的测评方法,加深了人们对阅读素养内涵的理解,网络情境下的阅读在纸笔测试强调获取、解读和整合、反思与交流的能力基础上,更注重对大量相关信息搜索、判断、整合与交流能力,这也成为适应未来信息化社会的重要能力。

    此外,计算机测试还为数学、科学和问题解决能力测评带来了一些额外的优势。首先,借助计算机的动态情境模拟,测试材料的呈现方式更接近真实情境,减少了对文字阅读的依赖,这从一定程度上克服了纸笔测试过分依赖抽象文字和静态图表的缺点,能更准确地对数学和科学素养进行评价。其次,计算机测评时,可以实时记录学生解题操作过程,据此分析学生不同的解题方法和思维方式。这种分析的结果对于教师根据学生特征组织教学,判断教学重难点都具有极大的益处。

    综合来看,计算机化的测评不仅是一种测评方式的改变,它还深刻影响了所测评的素养内涵。至此,在主要学科领域上,可以依据不同的测评方式把素养划分为纸笔测试素养和计算机测试素养。

    (四)顺应经济社会的趋势,纳入新的测评领域“财经素养”

    相比传统的基础学科领域,“财经素养”在很多国家还没有进入课程的范围。然而,在当今经济全球化的时代,财经的问题已经越来越多地渗透到人们的日常生活中。特别是在刚刚经历金融危机的背景下,个人如何保护和增加自己和家庭财富,国家如何确保经济和金融的稳定性,成为人们普遍关注的问题。

    OECD PISA财经素养框架中指出,拥有较好的财经素养会带来多种益处。例如,有研究表明,接受财经素养教育,成年人更可能会为退休进行储蓄和规划;拥有较多金融知识的人更有可能积聚更多的财富,能较好地管理债务,而且财经素养对于经济与金融的稳定性也尤为重要。除了对于个体的益处外,财经素养对于国家和经济体的经济与金融的稳定性也尤为重要。它能够促进形成更有效率的金融市场,减少政府的管理和监管费用。

    基于这样的背景,OECD认为,财经素养正逐渐被视为一项重要的生活技能。在青年人中开展财经教育并将其作为学校教育的重要内容具有重要的意义。

    与其他主要领域素养的界定类似,财经素养也关注学生对相关的知识和技能运用,以及在多种情境之下提出、解决并解释问题时能够进行分析、推理及有效沟通的能力。财经素养定义为:“一种关于财经概念的知识和理解力,以及运用这些知识和理解在财经背景中做出有效决策、提高个人和社会经济利益、能够广泛参与经济生活的技能、动机和信心。”

    根据对多个国家采用的财经素养框架的研究,PISA确定了货币和交易,规划和理财,风险和回报,以及金融环境这四个内容领域。并根据认知过程将财经素养划分为识别财经信息、分析在财经背景中的信息、评估财经问题、应用财经金融知识和理解力四个过程。将财经素养测评的背景确定为教育与工作、居家与家庭、个人活动和社会活动四类。

    财经素养是PISA素养内容领域的新内容。尽管其研究和关注程度都还不够深入,但并不能因此忽视其重要意义。

    三、PISA素养发展的路径及动力

    素养是一个不断发展和演进的概念,其内涵伴随着时代对于个体要求而不断发展。单从2000年以来PISA素养的概念的发展历程来看,我们可以归纳出两条发展路径。

    首先,基本内容领域纵向的不断深入。最初的PISA较多关注“阅读、数学和科学”三个学科领域认知方面的内容。随着对素养概念的不断反思,特别是发现动机因素、元认知因素与成绩之间的紧密关系后,非认知因素、元认知因素逐步纳入了素养的概念中。另一方面,尽管已经认识到计算机化 测评的重要性,但初期的PISA仍通过纸笔测试来进行,对素养界定自然主要关注印刷文本。随着信息和通信技术的迅速发展,在主要学科领域,人们的学习和工作方式已经发生了巨大的改变,计算机化测评呼应了这种时代的变革。测评方法的改变,同时也带来了测评内容、技能种类的变化,这也意味着在主要的学科领域,素养的概念因为媒介的变化,又加入了重要的新内容。

    其次,新兴测评领域的逐步加入。为了呼应人们对跨学科问题解决能力的关注,PISA于2003年推出了问题解决能力测评。这一开创性的测评突破了一般评估中受限于学科划分的缺点,扩大同时也还原了素养的领域。此外,在经济全球化的浪潮不断发展,财经素养逐渐显示出其对个人和国家的重要性的情况下,PISA把财经素养纳入到测评范围内,再一次扩大了素养的领域。

    PISA素养的发展看似没有特别的规律,但如果我们考虑到PISA测试初衷“考察学校是否为学生们应对未来社会挑战做好了准备”,就不难理解,无论是传统素养内容领域的深入挖掘还是新兴领域的不断加入,都很好地契合了这一出发点。可以说,社会发展对个体适应能力不断提出了更高、更多元的要求,这正是素养发展的源动力。

    注释:

    ①OECD(2001). Knowledge and Skills for Life-first Results from PISA 2000. Paris, OECD Publishing, pp. 99.

    ②OECD,陆璟,占盛丽,朱小虎.面向明日世界的学习——国际学生评估项目(PISA)2003报告[M].上海:上海教育出版社,2008.6,85.

    ③OECD,陆璟,占盛丽,朱小虎.面向明日世界的科学能力——国际学生评估项目(PISA)2006报告[M].上海:上海教育出版社,2010.12,96.

教育测评概念篇(5)

在《科学教育的原则与大概念》一书中提出的10条原则中,这是唯一指向教师培养的一条原则。每当读到这条原则,我总是禁不住思考要达成科学教育所设立的这些目标需要用怎样的教与学的方法?据该书第4章所述,目前被广泛认可的、能促进达成有效学习的科学课程教学法的一些特征包括:探究、个体和社会建构主义以及形成性评测。据此,可以说科学教师的专业发展和培训,也应与此保持一致。

2012年11月9日,在温暖的秋日里,我又一次见到了Gail Pook和Joy Parvin两位老师。和9月在约克时一样,有机会再次和两位老师共同组织“做中学”项目的教师培训,让我深刻地体会到面向科学教师的培训应该如何和科学教育教与学的方法保持一致,如何促进参训教师融入培训活动,既动手又动脑,达到提高教师培训有效性的目的。

科学教师是科学教育的主要实施者。有好的教师,才有好的教育。优秀的科学教师能够将探究、个体和社会建构主义以及形成性评测这些教学法恰到好处地和课程教学相结合。然而要做到这些确非易事,能够灵活组织课堂,根据学生的学习过程搭建有效脚手架的老师,其自身首先必须是个善于探究、懂得探究的研究者。

教师培训理应是一座通往专家型教师的桥梁,是教师不断成长、不断接受新知识、提高专业能力的过程。它给教师建立起一个学习、反思和成长的渠道。要成为具有研究能力的专家型教师,教师培训也需要运用一定的策略和方法,引入探究式的学习模式,将探究、个体和社会建构主义,以及形成性评测融合在培训的活动和环境设计中。

融合方法一:引入情境,设计探究问题

探究的学习环境需要有探究问题来承载教育的目的和实现科学教育的价值。科学教师的培训也需要设计出使教师愉快和充满好奇的,同时也有助于发展其理解和技能的探究问题,这样的问题往往来自于一些有意义的现实情境。

【实例】稀释胶水

这是一个来源于工业实际情境的培训活动。物质的特性是这个问题中涉及的重要概念。研究者需要理解什么是胶水的黏度、胶水的黏度与其黏合性能的关系是什么、如何测试胶水的黏度、如何测试胶水的黏合性能等原理。同时,研究者还需要寻找到能保持胶水黏合性能的最佳配比方案。这才是问题解决的关键,但这些都是基于对上述概念正确理解的基础之上。

激烈的讨论之后,一组老师找到了用粘贴的方法来测试黏合性能(如图1),另一组老师使用在斜板上测试流速的方式测试黏度(如图2),还有一组老师使用液体中落球的方法测试黏度,或使用在管道中的通过时间来测试。

在这个有意义的情境支持下,面对问题和任务,参与者必须考虑为了解决这个问题,需要做什么、测试什么,以及为什么要这样做。这使得探究成为有目标、有意义的过程。

融合方法二:思考与讨论,关注个体与社会建构

就像儿童的探究需要适宜的引导,有效的培训不仅需要情境和问题的引导,更需要参训者的参与和思考,小组之间的交流与合作。设计、规划、描述与反思,能够促进教师反思自己的认知和观点,向同伴解释自己的想法和意见,接受别人的建议,完善自我的想法,构建自己的思考,即实现个体与社会的建构过程。

【实例】教学案例的设计与展示

这是一个通过参训者小组设计案例,并进行交流、讨论和展示的培训活动。每个小组设计一个特定的教学案例,如基于工业情境的教学案例。设计时需要考虑这个案例涉及的研究问题、教学目标、教学过程、评测方法等。

小组讨论使得参训者独立思考、在小组中向同伴说明自己的观点;制作过程使得参训者用问题、图片等各种方式展现观点和成果;展示过程使得参训者有机会向更多的人阐述想法、争论和维护自己的观点(如图3);评价过程采用激励性的评测,使得参训者可以作为当事人接受评论、参与评论,同时也作为旁观者观察、倾听其他人的交流。

这是一个围绕教学设计形成的学习环境。它不同以往培训中的案例分析。它是老师们结合自身学科知识、教育教学知识而创造的产物,其中的每个部分都融入和表达了作者的教育观。在“展示会”的交流形式下,在“2个星星、1个希望”的评价机制下,形成了一个具有安全感的学习环境,一个畅所欲言的学习环境,一个以个体或社会交往的形式来发展概念和观点的学习环境。在Gail和Joy老师的推动和激励下,教师相互间的学习更加富有成效。

融合方法三:任务驱动,有效的形成性评测

形成性评测是探究学习的一个组成部分,是一个周期性连续的过程。要让教师理解和知道如何在教学中使用形成性评测,培训活动中也需要关注评测,甚至把评测显现出来,让参训者理解。在参训者看来,最为明显的形成性评测是培训过程中的互动和反馈。向老师们灌输理论往往不能引起参训者的共鸣和认可,因为理论总是抽象而不具体,很难和教学实际过程相联系。任务驱动则为培训者和被训者提供了共同的话语平台,信息的反馈变得自然和顺畅,形成性评测也显得更加有效。

【实例】冷却水

这是一个基于工业情境的探究任务,参训者需要找到迅速冷却热水的方法。一开始的培训活动是针对降低热水温度的方法。Gail老师将各组的想法绘制在白纸上,请各组解释和说明实验的设计。汇报实则是培训者进行形成性评测的有效时机,Gail老师通过各组的汇报了解到他们的问题和困难,以便在接下来的实验中给每个小组有效的帮助和指导。实验结束后,Gail老师要求每个小组把实验数据汇总在白板上(如图4),其实记录也是培训者用来进行形成性评测的一种工具。通过记录,Gail老师了解到老师对数据记录、表征、处理方法等方面的问题,以便她明确下一步培训的重点在哪里。

仔细回顾培训的整个过程,不难发现在老师们完成任务的过程中,Gail老师始终在关注和使用形成性评测。评测信息的反馈帮助她及时调整培训方向,抓住参训者的困难和薄弱这处重点培训,这大大地增加了培训的有效性,也使得参训老师得到更大的收获。

教师作为成年人,作为教育工作者,其学习方式有别于儿童。他们具有丰富的教学经验,能根据自己的需要确定学习的需求,并希望能够把知识和技能融入到实际教学工作中。因此,教师是具有自主能力的、能从别人的经验中学习的个体。科学教师的培训必须立足于教师的工作实际,引入探究式的学习模式,将探究、个体和社会建构主义,以及形成性评测有机地融合在一起,给参训教师提供一个精心设计的、有安全感的、互动的学习环境,促进他们在动手的同时动脑思考、用心交流,在培训者和参训者之间形成一个学习的共同体,这样才能有效地促进学习过程的产生,提高培训的深度和质量。

教育测评概念篇(6)

现代教育心理学认为:“教学目标就是预期的学生学习结果。”一般说来,教学目标是教师根据课程教学目标和学生的实际情况而制定的。它制约教学过程、方法和师生的课堂活动方式。所以,教师在从事教学设计的时候,首先要使自己的教学目标定位适当,

然后尽可能用可以观察和测量的行为动词术语清晰地陈述目标。这对其教学行为的科学性具有决定性的意义。然而,在实际的教学中,很多教师的教学研究常侧重教学方法,对教学目标的关注不够。在教学设计中虽有明确写明教学目标,但却是模糊的、缺乏可操作性的。这使得教师的教学方法、教学过程、教学评价的设计与所确定的教学目标脱节。更有甚者,有些教学目标的设置和陈述出现了非常严重的逻辑错误。这些教学目标对于教学而言没能发挥其应有的作用,难以有效地具体指导教学实践。下面笔者结合自身的教学实践就思想品德课教学目标的正确设置和陈述及其作用进行论述。

一、教学目标的设置和陈述

(一)指导教学目标设置的理论――布卢姆教育目标分类学

为了解决目标模糊的问题,教师需要使目标更加准确,需要一个有组织的框架来提高准确性,更重要的是促进理解。在《学习、教学和评估的分类学――布卢姆教育目标分类学修订版》一书中,根据布卢姆教育目标分类学,并吸收40多年来认知心理学的研究成果,将认知领域的学习归结为四类知识的学习:事实性知识、概念性知识、程序性知识,反省认知知识,又将对知识的认知过程划分为记忆、理解、运用、分析、评价、创造六个等级水平。在实施教学之前,这四类知识是外在于学习者的,学生个体获得外在知识的过程要经历由低级至高级的六级水平的认知过程。由此构成了两个维度的目标分类表:

这就是说,教师在教学前,应对所教内容按知识类型和认知过程两个维度设置教学目标,用以指导学习、教学和评价。例如:九年级《计划生育的基本国策》,在《广州市义务教育阶段学科学业质量评价标准思想品德》中“知识:2.2.4我国的人口国情”“能力:描述我国的人口国情和特点”。据此,我们设置教学目标1:“学生能分析图表等数据,描述我国人口国情和特点。”行为动词有“分析”和“描述”,意味着“解释”即属于“理解”的认知维度;名词“人口国情和特点”属于“概念性知识”。所以,这个教学目标放在维度分类表就是:

通过分类表,可以看出目标1是涉及理解概念性知识。一旦我们理解了“概念性知识”和“理解”的含义,就能更清楚地了解这些目标。所以,将教学目标的设置置于分类表的框架中就能增强我们对教学目标的理解。

(二)教学目标陈述的格式和注意事项

1.教学目标陈述常用的格式

(1)行为动词+限制词+核心名词(概念)

(2)行为条件+行为动词+限制词+核心名词(概念)

(3)行为程度+行为动词+限制词+核心名词(概念)

无论采用哪种格式,教学目标的陈述最基本要包括动词+名

词。动词一般描述预期的认知过程,它是置于认知过程维度的六个类目即记忆、理解、运用、分析、评价、创造的背景中考查的。名词一般描述期望学生掌握或构建的知识,它是置于知识维度的四个类别即事实性知识、概念性知识、程序性知识、反省认知知识的背景中考查的。

2.教学目标陈述的注意事项

(1)要注意使用正确的动词术语陈述目标

在教学目标陈述的格式中,通过不同动词术语的使用,关注认知的过程和方法,界定对学科知识怎样运用和应用学科知识做到什么样的认知水平。我们要避免使用不可捉摸的动词,而要力求使用明确、具体、可以观察和测量的动词。修订的布卢姆目标分类对记忆、理解、运用、分析、评价和创造及其更加细致的次分类别的各类动词作了准确的界定,而且这些动词是经过心理学严格界定的。如下表:

而未经过教学心理学严格界定的动词,只能传达常识性意

义,难以起到三个导向作用,如:“培养学生革命的大无畏精神”或“提高学生的创新能力。”“培养、提高”含糊其辞,难以评价。

(2)目标陈述的行为主体是学生,而不是教师

在很多时候主语“学生”和“能”这些词语是可以省略掉的。但如果像“使学生树立……观点”“通过……使……”“培养……能力”等的陈述句,主语就成了教师而不是学生,这是违背逻辑的。因为“目标要描述通过教学后学生在知识、技能、学习方法和情感态度方面的变化。”所以,教学目标不应该描述成教师做什么,而应该描述成学生“应该知道什么”“能够做什么”。

(3)不要以“目的”代替“目标”

一些教师将两者混为一谈,如:“使学生成为德智体全面发展的人。”这样的陈述不表示学生学习的结果,也不符合目标陈述的要求,不能称作目标。

二、教学目标的导教、导学和导测评作用

教学目标以学生学习结果为导向、以可测量为原则、以提高质量为宗旨,力争发挥导教、导学和导测评作用,促进学、教、评三位一体。

(一)导学――指导学生主动、自觉、高效学习,有效自评

所谓“导学”就是目标能够明确告诉学生,通过学习他们能够学会什么。学生的学习一般是目标指导的学习。教学目标给学生提供他们如何学习的重要信息,帮助学生了解教学内容和要求。

对于中学生,教师可以直接向他们宣布教学目标,明确地告诉他们,当学完某个课题或者某个教学单元后,他们应该掌握哪些技能,会做哪些事,或会分析、说明什么问题等。清晰的目标可以向学生确切地传递教师的教学意图,具有交流的功能。学生看到教学目标后,就知道自己要学习的内容,以及学习之后可以根据教学目标来评价自己是否达到教学目标所提到的要求。所以,学生使用教学目标,可以提高学习的自觉性和主动性。

(二)导教――指导教学方法和过程,引导教师规范教学行为,把握教学的容量和难度

所谓“导教”就是目标中暗含要教会学生的知识、技能、认知策略是什么。一旦教学目标确立以后,教师就可以选用适当的教学过程和方法,如:讲授法、发现法、小组讨论法等。这就解决了“教师怎样教给学生?”的问题。在教学目标中采用动词+名词的结构方式,名词指出了知识,解决了“我要教给学生什么?”的问题,动词指出认知过程,解决了“教到何种程度才可以?”的问题。科学地设计和实施教学目标让教师控制了教学的容量和难度,在一定程度上可以避免教学的随意性,有利于规范教学行为,解决教师教学中常常存在的“难度无数、拓展无度”问题,具有很好的导教作用,即目标决定教学。

(三)导测评――指导教学结果的测量和评价,引导教师实施有效的学业评价

所谓“导测评”就是目标应暗含观察学生学习结果选用的条件。新的教学论主张对照教学目标测量和评价教学效果。在前面我们提到教学目标就是预期的学生学习结果。而学生学习的结果是内在的能力和倾向的变化。原本这种变化是不可观察的,也不可能直接测量的,但在陈述教学目标的时候,我们用了外在的可观察和可测评行为动词术语(即布卢姆区分认知领域的六级目标)来陈述学生内在的心理变化,那么教学结果的测验题就已蕴含在教学目标之中了。所以,有了可以操作的水平不同的具体目标,测量和评价就有了可靠的标准,起到导测评作用,即目标决定教学结果的测量和评价。

下面,我们通过一个例子来说明一下。例如:七年级下册《走进法律》,在《广州市义务教育阶段学科学业质量评价标准思想品德》中“知识:3.2.4犯罪”“能力:结合典型案例能区分一般违法行为与犯罪行为”。据此,我们设置教学目标“学生能结合典型案例,通过对比分析说明,能区分一般违法与犯罪的相同点和不同点。”行为动词有“对比”和“区分”,“对比”意味着“比较”即属于“理解”的认知维度;“区分”意味着“分析”的认知维度。

从导学来看,学生看到目标,就知道他们通过学习,最低限度要知道什么是一般违法和犯罪,两者的不同点、相同点是什么和有什么联系,在实际的例子中能区分开。这是“理解”和“分析”水平的要求。

从导教来看,老师看到目标就知道目标中暗含的是“概念教学”。教师可以侧重教概念的“关键特征”,使用典型的正例和反例,设置情景探究,将这些概念嵌入一个较大的概念框架之中,让学生进行分析并讨论这个框架中的相似点和不同点,从而提升学生分析和理解的能力。(具体例子如下:)

展示材料:

材料一:著名音乐人高晓松,在北京醉酒驾车导致4车连环相撞,4人受伤,最后被拘役6个月,处罚金。

材料二:某交警大队查获一名男子酒后驾车,该男子被扣6

个月机动车驾驶证,并处1000元以上2000元以下罚款。

问题探究:

完成下列表格并回答:为什么同样是违法,处罚却不一样?两者有什么区别?

采取这种发现式教学方法,学生在讨论探究的过程中分析、

理解、解构问题,在对比中找出概念之间的差异,区分一般违法和犯罪,进而更加明白“犯罪的本质特征”,达到对“概念性知识”的“理解”,从而突破了目标。

从导测评来看,这个目标涉及“概念性知识”,其测验题原本是较难以编写的,但目标具体化后,就变得容易了。目标陈述本身暗含了测量方法,方法就是让学生辨别和选择,而且评估的任务不是与教科书上的或教师上课使用的完全相同。那老师就可以给予若干“一般违法”和“犯罪”概念的正反例,让学生进行识别。例如:

李某是某中学的三好学生,因沉迷网络游戏经常进入网吧,

结识一帮社会不良青年,开始逃课。为了解决上网的花销,开始在社会上偷窃财物,受到公安机关的拘留;但仍不思悔改,多次进行拦路抢劫,最终因抢劫罪被法院判刑。

根据材料回答:李某的行为哪些是一般违法行为?哪些是犯罪行为?

通过这样的反馈来进一步验证教师的这种教学方式是否真的使学生达到了“理解”和“分析”的能力要求。

所以,只有目标的陈述具有导教、导学和导测评作用,才能

实现“学有目标”――有效地促进学生日常的学科学习,“教有依

据”――有效地规范和引导教师的教学,“评有标准”――有效地引导教师对学生学习结果的评价,学、教、评三位一体。

参考文献:

[1]L.W.安德森.学习、教学和评估的分类学[M].皮连生,译.上海:华东师范大学出版社,2008-01.

教育测评概念篇(7)

第二,从德育价值实现的角度理解德育实效。“德育实效的实现与德育价值的实现是同一过程,德育实效的效果等同于德育价值”。“德育实效实质上是德育价值的实现”。从德育功能或价值角度理解德育实效具有一定的新意,并且也可以把德育功能的发挥或价值的实现与德育实效紧密联系起来。但是,不论是德育功能的发挥,还是德育价值的实现,最为根本的还是教育内容要求被教育对象认同、接受和实践。否则,就意味着德育功能或价值丧失。从最直接、最根本意义上看,德育实效是教育内容要求被教育对象认同、接受和实践的现实状况,把德育实效理解为德育功能发挥或德育价值实现,只是看到了德育实效的表面现象,并未透过现象揭示德育实效的深层本质。

第三,“德育实效性,既包括实际取得的效果,又包括德育的投入与实际收效的相应比例,即投入与产出之比”。“德育实效包括德育效果和德育效率两方面。德育效果是指在一个德育过程结束后德育工作所得到的结果。德育效率是指德育工作所得到的效果与取得这个效果所用的教育工作量之比,即德育效率=德育效果/教育工作量”。此两种观点主要是从经济学的角度理解德育实效,把德育实效理解为德育的投入产出比。这种德育实效的比例观不乏创意,其借用了经济统计原理,但未能揭示德育实效的本质内容,形成的德育实效概念对德育实效的理解及其测评并不具有可操作性。“德育实效本来就是德育活动的实际效果,这既是最简明的也是最明白的含义,然而人们受到经济思想的影响,把经济学的一些理论套用在德育活动中。诸如效益’、‘效率’、‘德育成本’等概念,都是经济领域术语的泛化。”对德育实效的理解归根结底是按其生成规律去揭示其实际效果的本质,而不是引入复杂的投出产出比来核算。德育实践虽有数量化的特征,但德育实践的精确量化相当困难,这种比例观值得商榷。

目前,人们关于德育实效理解的诸多观点,不论是德育实效的目标观、功能观、价值观,还是比例观,都没有揭示其本质内涵。其实,从根本上看,德育实效无疑是教育内容要求被教育对象认同、接受和实践的实际状况。把德育实效内涵界定为教育者使教育内容要求被教育对象认同、接受和实践的现实状况,是对德育目标达成、德育价值实现或德育功能发挥、德育成本效益等现象的本质揭示,为德育实效测评提供了新的可能和方向。

二、德育实效测评的现状把握

加强德育实效的考评,不仅要澄明德育实效的内涵,还应把握德育实效测评的现实状况。在现实中,德育实效测评属于德育评价的范围,应对蕴涵于德育评价的德育实效进行考评。

(一)德育评估指标体系的评价模式

在现实中,建构德育评估指标体系是人们把握德育实施状况的主要方式。德育评估应该对德育实施状况进行全面系统的评估,建立全面系统的评估指标体系。在德育评估过程中,建立的评估指标体系越全面、越系统,就越具有科学性、权威性,因而往往会建立起涵括所有德育实践要素的指标体系,有多少德育要素和环节,就要建构多少德育评估指标。有学者提出从教育主体、客体、环境、过程、效果五个方面来设立评估指标体系。其实,德育评估指标体系的评价模式注重的是对整个德育实施状况的全面系统性评估,而现实中这种流行的德育评估指标体系的评价模式是力求涉及德育实践的所有方面,而不是对德育实效的专门性评估。

德育评估指标体系的评价模式无法实现对实效的有效评估,原因在于此种评价模式是基于教育目标建构的。德育评估指标体系的最大特点是对教育目标的层层分解,用主观设定的教育目标评估德育实施的状况,甚至德育评估尤其教育效果的评估就是用预期的教育目标去全面衡量德育实施的状况。“教育评价应按照指标体系分类,任何一种教育期望,都必须制定成特定的教育目标,并在评价中将目标转换成一个指标体系,教育评价实际上就是根据这个指标体系来衡量某一教育行为或对象达到的指标程度。”

可知,德育评估指标体系的建构主张教育目标尽可能全面地考察德育实践的要素和环节,并保证德育实践要素和环节符合教育目标的要求。但是,如前所述,评估德育实效应基于教育内容的接受状况,而不应立足于层层分解抽象空洞的教育目标来评估德育实效。因为目标往往具有主观随意性,用主观设立的目标评估教育内容被认同接受状况的客观现实,本身就值得讨论。在现实中,评估德育实效受到预期教育目标的影响,导致一般民众对德育实效评估具有主观随意性,结果往往都认为目前德育实效低下或实效不理想。当然,我们不否认在现实中建构德育评估指标体系的价值,如果不是为了遵循德育实效的本质去单纯地测评实效本身,而是为了把握德育运行的整体状况,那么基于教育目标建构包括各个德育实践要素和环节的评估指标体系,就显得十分重要。

(二)品德素质测评体系的评价模式

目前,在德育实效测评方面有一种比较流行的评价模式,即德育对象品德素质测评的评价模式。人们把德育评价的重心放在对德育对象的品德素质测评上,主张品德测评是德育评估的核心以及德育评估可以通过德育对象的品德测评获得实现。“学生思想品德评价本身就是学校德育工作的一部分,学校德育成效的评价也是通过学生思想品德评价来实现的。”对此,人们往往把德育评估转换成品德测评进行探索,尤其在评估德育效果时往往是通过评价学生的品德素质状况来实现的。于是在德育领域,人们就形成了企图通过教育对象品德素质测评来评估德育效果的评价模式,德育实效的评价转换成通过建构教育对象品德素质测评体系的评价方式来进行。因而,建构教育对象的品德素质测评体系就成了人们德育评估的重要方式,也是人们评估德育实效的直接方式。那么,在德育领域中形成的品德素质测评体系是否可以实现对德育实效的评估呢?品德素质测评体系的建构是依据人的品德素质结构要素来确定测评指标的体系,即来自对人的品德素质结构要素的层层分解。肖鸣政指出:“品德测评是一种建立在对品德特征信息‘测’与‘量’基础上的分析与评判活动。在这种活动过程中,测评者通过‘测’与‘量’的活动,获得所要搜集的品德特征信息,然后对它们进行综合分析与评判解释。”

但是,德育实效本质上是教育内容要求被教育对象认同、接受和实践的现实状况,因而,测评德育实效应该基于德育实效的本质及生成规律。虽然德育实效与教育对象的品德素质有着密切关联,但却不能说德育对象品德素质的状况就是德育带来的实际效果。实际上,个体的思想品德是包括教育、社会和自我在内的多种因素综合作用的结果。基于人的思想品德结构特征建构品德素质测评体系的评价模式,实际上无法实现对德育带来的实际效果本身的有效测评。根本原因就在于其混淆了德育评价与品德测评概念的关系。其实,“虽然德育活动的最终目的是促进学生品德的发展,但是学生的品德发展不能完全反映德育活动的成效”。德育实践对教育对象品德形成只是充分条件,学生品德形成不一定就是德育实践的效果,因而把德育评估尤其实效测评就想当然地转换为品德测评是不正确的。当然,在把握品德素质测评体系的评价模式无法实现对德育实效的有效测评时,有必要回应现实中人们习惯于从教育对象品德状况的角度评论德育实效的偏颇做法。

在现实德育教学中,从品德素质测评体系评价德育实效有一种比较常识性的表现,就是人们往往从教育对象品德问题角度来评论德育实效,习惯把教育对象表现出来的品德失范,归咎于德育的低效或无能。德育便成了“替罪羊”,只要是社会道德或学生品德出现了问题,就习惯性地以德育低效为祸首。其实,德育实践虽然要促进学生的品德发展,但是若因学生品德问题的存在就直接否认德育实效,这不仅没有看到学生品德形成受到除教育以外因素的影响,也没看到正是由于学生品德存在问题才需要开展德育实践。因此,有必要纠正现实中从教育对象品德问题状况的角度评判德育实效的这种偏颇做法,同时,更应明确品德素质测评体系的评价模式无法实现对德育实效的有效评估。

(三)德育实效宏观检验标准的评价模式

目前,根据德育实效测量尺度客观要求,人们提出了从宏观哲学视角检验德育实效的标准。郭政等人提出战斗力标准和提供精神动力、提供保障标准。王鲁宁等人提出直接效果与间接效果统一、思想转变与行为转化、价值取向与价值实现的标准。项久雨认为评估的标准包括最高标准、根本标准和具体标准,其中,实践体现是最高标准;“三个有利于”是根本标准;具体标准是在根本标准指导下的具体化、系统化的价值尺度系统。因而,可以把这种衡量德育实效标准的探索看做是目前我国在德育领域形成的一种代表性的教育实效评价模式,即检验德育实效宏观标准的评价模式。通过梳理我国德育领域目前存在的标准,可以发现,这些标准的制定和提出大多是抽象宏观的,这些标准不仅适用于德育领域,往往也适用于其他领域。它们并不是对德育实效的专门测评,缺乏对德育实效内涵的本真理解以及对德育实效的反思。

同时,这些标准的制定大多是以德育实践的外在因素作为衡量实效的标准。“大学生德育效果评估的指标标准最终的物质承担者是人、物和环境等三个量化指标。”大学生思想政治教育评价标准,应该根据高校人才培养和社会发展的需要不断创新,以促进大学生成功就业创业,将其作为大学生思想政治教育现实成效的实践评价标准。人们可以从不同的角度理解德育实效,但从最直接最本质的意义上看,德育实效无非就是教育内容要求被教育对象认同、接受和实践的现实状况。在德育领域中,以德育实践外在因素为依据制定的检验德育实效的宏观标准往往无法具体衡量现实中的德育实效,它既不能检验出一堂课的教育效果,也难以区分不同学段、年级和教育者带来的实效。可以说,这种检验德育实效的宏观标准在涉及具体的德育实践及其实效时其测评是无效的。

三、德育实效评价模式的前瞻

目前,我国的德育领域虽形成了具有代表性的德育实效评价模式,但尚未形成科学有效的德育实效评价模式。当前我国德育领域紧迫的现实任务是在对德育实效测评现实困境进行反思的基础上,对具有可操作性的德育实效测评模式进行理性前瞻,研究科学合理的、具有可操作性的德育实效测评模式。笔者以为,应根据教育内容要求建构德育实效测评标准,这是具有可操作性的新模式,是基于德育实效本身并且是专门针对德育实效提出的测量尺度。目前诸种德育实效测评模式无法实现对德育实效的有效测评,根本原因在于其没有找到德育实效测评的客观根据。德育评估指标体系以教育目标为根据无疑会导致从预想效果去衡量现实德育实效。

人的品德素质测评体系以品德结构为根据很容易导致对德育实际效果的过度测评。如果将德育实效的宏观标准以生产力等为依据,则必然带来实效测评的抽象空洞。对德育实效开展测评,是要测评教育者将传授的教育内容在教育对象身上有所体现和反映,是要看教育对象是否接受、认同和实践教育内容要求及其程度和水平。因而,德育实效作为教育内容转化为人们接受、认同和实践的现实状况,需要专门的测量尺度。同时,根据教育内容要求建构德育实效测评标准,可以实现要求什么内容就考量什么内容的目标,把德育要求的内容和考量的内容统一起来,即考量的也是要求的。衡量和测评德育的实效必须以教育内容要求为根据,而不是以其他因素为根据。基于德育实效与教育内容要求的现实性联系以及德育实效测评的经验反思,德育实效的测评应根据教育内容要求建构德育实效测评标准。

当然,以教育内容要求为德育实效测评的根据,就应对教育内容进行概括分类,把教育内容要求抽象概括成不同维度的初级指标,然后根据每类维度进行次级指标、再次级指标的抽象概括。德育实效测评就是要测评这些经过抽象概括并实现简约化或类别化表达的教育内容要求被教育对象认同、接受和实践的现实状况。对此,可以将教育内容要求抽象概括为知识理解、观念认同和行为外化三个维度,建构德育实效测评标准的指标。不论是国家关于德育的政策、纲要和意见中涉及的教育内容要求,还是德育课程标准及教材涉及的教育内容要求,以及日常的德育活动、行为规范涉及的教育内容要求,都可以从三个维度进行抽象概括。

如此概括教育内容,基本上涵括了教育内容要求的全部维度,因为德育无非就是在传授一定的知识,培养一定的观念,形成一定的行为。在德育过程中,尽管还会涉及对情感的培养和意志的训练,但是情感基本属于观念领域,意志很大程度属于行为领域,因而从知识、观念、行为三个维度概括教育内容要求符合德育内容要求的基本状况。基于此,德育实效测评标准的指标设定就可以立足于这三个维度,对德育领域纷繁复杂的教育内容要求进行抽象概括。德育实效测评标准以教育内容要求为构建依据,经过抽象分析,将德育领域纷繁复杂的教育内容要求概括为三个方面:知识上的理解、观念上的认同、行为上的实践,来考评教育内容要求被教育对象认同接受和实践的现实状况,可为德育实践者抽象概括特定学段或年段的教育内容建构德育实效测评标准提供思维理路和技术路线。德育实践者可以根据德育学段实际进行划分,系统把握各学段的德育大纲、德育课程标准、德育教材以及学生日常行为规范中的教育内容要求,并从知识理解、观念认同和行为外化等三个维度进行抽象概括和具体细化,进而分别建构不同学段的德育实效测评标准。

教育测评概念篇(8)

为什么要采用预期成果

NGSS指出,过去的科学教育标准将科学的3个维度视为需要在评测或教学中受到重视的孤立的不同组成部分,这使得在科学教育过程中各维度之间的关联被人为地割裂,对科学教育目标的达成造成了一定程度的阻碍。要解决这一问题,就必须采用一种可以将各维度内容结合在一起的方法。

之前的科学教育标准中只列出学生应该“知道”或“理解”的内容。其实这些内容需要被转换成可以用来进行评测的学习成果,才能确定学生有没有达到标准的要求。当然,不同类型的转换有时也会导致出现偏离课程和教学的评测现象。鉴于之前的困难,NGSS将采用一种能够说明学生应该达到什么样水平的呈现形式,以表明他们已经达到了标准的具体要求,这样才可以为课程、教学和评测提供统一的明确和具体的目标。这就是预期成果。

因此,每一个预期成果都整合了框架中所有的3个维度——科学与工程实践、学科核心概念及跨学科概念,这代表了一种更为综合的学习科学的观点,希望鼓励学生参与科学活动时更接近科学家的实践,因此强调了实践与知识不能分离的重要性。此外,每一组预期成果还列出了与科学与工程领域学科中其他概念的联系,以及与数学和英语语言艺术领域的“通用核心国家标准”的联系。

什么是预期成果

预期成果是NGSS的重要组成部分。预期成果详细说明了学生应该知道什么,理解什么,以及能够做到什么,即描述了希望学生掌握该条标准后所应达到的能力和水平,以及对他们的表现进行评测的标准。同时,预期成果也阐明了学生要如何参与科学实践构建对基本知识的更好理解。这些预期成果通过提供可测量和观察的任务,为有针对性的教学和评测提供了依据。所以从某种程度上说,这些预期成果可以独立地作为“标准”。

同时,NGSS还指出理解预期成果时需要关注的3个要点如下。

第一:关注预期成果的所有方面

考虑到每一条预期成果都允许有多种评测手段,因此所有学生都应该展现他们在预期成果所有方面的水平和能力,这里的所有方面指向所有领域和要求。这是需要特别关注的,因为在这一点上NGSS与之前的标准有着本质的区别。尤其对高中阶段来说,之前的高中已经习惯性地让学生选修一部分学科课程而不是全部。NGSS特别强调了对此问题的关注,指出一个具有科学素养的人应该在每个主要的科学学科中都能够理解和运用核心概念,并在科学与工程实践和跨学科概念中获得一定经验。换言之,NGSS关注在K—12年级期间,学生在物质、生命、地球与空间、工程设计4个领域方面的协同发展,这4个领域同样重要,尤其在高中阶段,不能偏科。

第二:预期成果不应限制课程

为了便于读者的理解,NGSS的预期成果中包含的核心概念只限于框架中所列出的核心概念的一部分,并且预期成果表示的是一个结合3个基础框内容的“大概念”,列出的仅仅是重点,并没有限制教学。感兴趣的学生可以以这些预期成果为基础,选修一些更高级的科学与工程的课程内容。

第三:预期成果不是一组教学策略或评测任务

预期成果并不是一组教学或评测的任务。而是学生在教学后通过学习可能达到的能力和程度。各个州、地区的教师可以根据这些预期成果有针对性地帮助学生达到这些标准。

“预期成果”的结构是怎样的?

在NGSS官网上给出了预期成果以主题(topic)和学科核心概念(DCI)两种方式的排列结果,每种排列针对某一主题或某一核心概念。图1是NGSS具体内容的框图形式,中间灰色区域即为预期成果。

为了说明预期成果的具体结构,表1中通过实例表示4年级物质科学领域中第4个核心概念:波及其在信息传递技术中的应用(PS4)的具体内容。

表1中,每一个框图的标题表明所对应的核心概念。标题下方的栏目中列出了预期成果的具体内容。预期成果及其相应的代码(4—PS4—1)说明该条预期成果是建立在哪个具体实践、学科核心概念和跨学科概念上的。由于所有的概念条目都具有若干条预期成果,这种代码便于读者查阅各个基础框中的信息是如何建构每条预期成果的。代码的第1位表示年级,后面3位表示相应的学科和核心概念,最后1位表示预期成果的顺序,同时对应于该核心概念的各个分解概念。接着代码的是预期成果的表述,其中包括能表示学习成果的行为动词和知识点,如“建立波的模型,从振幅和波长两方面描述波的模式……”。

这些预期成果结合学生需要学习的技能和概念,同时提出了评测4年级学生是否获得下方3个基础框中指出的能力和理解的方法。

需要注意的是,虽然预期成果可以单独存在,要想更连贯、更完整地获知学生应该达到的标准,还是要结合下方的框中的内容,即分别列出了具体的科学与工程实践、学科核心概念以及跨学科概念,上述预期成果是这3个维度的相互结合。

预期成果是如何整合评测和3个维度的呢?

预期成果与评测的整合

预期成果是如何指导评测的呢?如上所述,预期成果描述了希望学生掌握该条标准后所应达到的能力和水平,并提供可测量和观察的任务描述,为有针对性的教学和评测提供了依据。如预期成果4—PS4—3是“形成和比较利用模式传递信息的多种解决方案”,其中“形成”和“比较”就是教师可测量和观察的评测点的具体行为描述。指明教学评测时期望学生能在实践(建构解释和设计解决方案)时使用一些概念知识(信息技术和仪器、模式)形成和比较“利用模式传递信息(信息传递技术)的多种解决方案”。

因此,教师要寻找的是能证明学生已发展出以下的能力和理解的证据,如:

学生能理解数字化信息可以传递很长的距离而无明显衰减;

学生能理解一些高技术设备可以接受并解码信息——将它从数字形式转化为声音——反之亦然;

学生能够基于它们对所设计解决方案的标准和约束条件的满足程度形成和比较一个问题的多种解决方案;

学生能够利用模式的异同点对所设计的产品进行排序和分类。

因此,预期成果与评测的整合说明评测应采用横跨多个事项的一系列广泛的标准。

从表1还可看出,预期成果的评测任务包括很多体现“做”科学含义的社会化和概念化特征,例如讨论和辩论、建模和表征。当学生被要求展现对这些特征的认知时,他们就必须展示出“做”科学的证据,以及评论和交流已经“做”的证据。

这些评测任务还可以按年级段收集起来,以形成一系列说明学生对知识的理解和相关能力展演的证据。

此外,每条预期成果后面都有1~2条用较小字体表示的附加句。这些附加句包括“说明”和“评测界线”,“说明”给出了预期成果的实例或补充说明,“评测界线”则指出了评测的限制。

这里“说明”可以作为教学活动或评测时所运用的例子。例如,“说明:模型的例子可以包括图表、类比以及用电线说明波的振幅和波长的实物模型”;“评测界线”则明确阐述“对处于某个特定水平的学生,哪些是不被预期的表现”的说明。又如,“评测界线:评测不包括干涉效应、电磁波、非周期波或振幅和波长的定量模型。”这样的评测界线有两个目的:一是界定何种详细程度是合适的;二是指出在相应的年级段末,要让所有学生掌握与某个核心概念相关的哪些知识可能是有挑战性的。

预期成果与实践的整合

预期成果整合了用于建构它们的科学与工程实践,体现在基础框的第一栏中。可以发现,NGSS的每一条预期成果中对学习程度的描述都是以指向实践维度的动词描述。这点充分说明学生需要通过参与这些知识建构的实践过程,去解释和形成对周围世界的科学认识,并熟练掌握核心概念。预期成果的这种整合是由于考虑到:学生没有参与探究实践以及使这些概念形成和完善的讨论,就不能完全理解科学与工程概念;同时,他们不能在实践中学习或展示其能力,除非在具体内容的情境下。因此,这种整合也充分体现了《框架》中新增的指导原则“关注核心概念与实践”。

通过收集关于学生在多个学科领域的具体情境中运用实践的证据,预期成果可以指导评测。表2统计了NGSS 4年级的预期成果中各个领域的实践维度上的成果目标。从表中不难发现,评测内容不再是简单的“知道、了解、认识”,而且与8个实践维度相关,如表2所示。

运用NGSS官网上的搜索功能,可以找出与某一实践相关的分年级段的预期成果,如表3中给出“建立和使用模型”这一实践维度在所有年级和领域中的预期成果编码。这无疑体现出学生对这一实践维度的学习需要整合在各个领域,并贯穿于整个K—12年级的学习过程,而不是一个为期2周的教学。

预期成果与学科核心概念的整合

预期成果与学科核心概念的整合是显而易见的。NGSS官网上给出了两种不同检索方式排列的NGSS内容标准部分,即按照学科核心概念排列和按照主题排列。其中一种方式就是列出与每一条核心概念所对应的预期成果,如图2中“以核心概念方式排列”图中所示。不仅如此,在预期成果下侧中间的框中还累出与之相联系的学科内和学科间核心概念,以指导这一概念的教学与学习。图2中还给出“以主题方式排列”的框图,同样显示出与该主题相关的学科核心概念,以及与之相关的学科内和学科间的核心概念。

可见,两种排列方式呈现的框图中都鲜明地指示出这些预期成果所对应及所相关的学科核心概念。

预期成果与跨学科概念的整合

从图2的框图中不难看出,预期成果下侧右边框中强调了适用于这些预期成果的跨学科概念。相应的预期成果根据评测限制了跨学科概念的个数,侧重于那些在学习学科核心概念时显而易见的跨学科概念。虽然并不全面,但指导了教学。因此,同实践一样,基础框中列出的只是重点,而所有的跨学科概念都应该在每个年级段内进行强调。

此外,整合跨学科概念也为学生提供了不同学科内容领域的相互联系以及相关的认知手段,能够丰富他们对实践的运用和对核心概念的理解,因此,预期成果整合跨学科概念具有一定的价值,可以收集学生对跨学科概念理解能力的证据,指导评测。

教育测评概念篇(9)

中图分类号:TP311文献标识码:A文章编号:1009-3044(2010)08-1921-02

Analysis and Design of School Education and Teaching Evaluation System Database

PAN Guo-rong

(Changzhou Liu Guo-jun Higher Vocational and Technical School, Changzhou 213004, China)

Abstract: An evaluation database was designed based on the requriment analysis of the schooleducation and teaching evaluation system. It can realize themaintenance of the essential information, and the query and statistics of evaluation data. The needs analysis,conceptual design ,logical design etc. was disscussed in the entire design.

Key words: evaluation system; needs analysis; logical design; E-R diagram; relational model

学校教育教学情况测评是指学生对班主任教育情况及任课教师教学情况的评价,我校一直以来都非常重视学生对教师的评价。从1998学年开始,学校教务处会在每一学期的期中考试前或考试后,统一组织学生进行测评。最早采用的测评方式就是给每个学生发一张评价表格,测完后以班级为单位装订成册,供领导和教师查询,这种方式的主要缺点是查询不方便且无法统计分析;从2005学年开始,改为学生按评分规则填涂卡,教务处用读卡机读卡并统计,最后将所有测评情况汇总成册,供主要领导查阅,采用这种方式虽然能作一些统计,但统计方式单一、查询不方便,也耗费资源,班主任和众多任课教师很难及时、方便看到测评结果,尤其是学生对学校的意见、建议及评价信息。在学校加强信息化管理的大趋势下,学校于2008年初提出要开发一个基于计算机网络平台的学校教育教学情况测评系统(简称测评系统),以提高测评工作的效率,提升教学管理水平。

1 需求分析

需求分析是整个系统设计过程的基础,要收集数据库所有用户的信息内容和处理要求,并加以规范化和分析,这是最费时、最复杂的一步,但也是最重要的一步,它决定了以后各步设计的速度与质量。需求分析做得不好,可能会导致整个数据库设计返工重做。

测评工作在我校已开展多年,本人对测评过程也比较了解,该项工作的主要负责部门是教务处。教务室工作人员提供了原先使用的测评评价表(见图1)及测评情况汇总表,明确提出了对测评系统的要求,通过分析,主要有以下几方面的要求:

1)学生能在校园网上登录系统,并且每个学生登录的用户名及密码是不同的;

2)学生测评时是不记名的,并且只能对本班班主任及任课教师进行测评;

3)测评的项目见图1测评评价表所示,这些项目和分值是相对固定的,即项目数不变,项目内容和分值在不同的测评中会有所调整;

4)学校领导及教师能在校园网上登录系统并查询测评数据;

5)测评数据可以用多种不同的方式汇总并查询。

2 业务流程分析

根据对测评的需求进行分析,可以得出测评系统主要的业务流程如图1所示。

由以上业务流程,可以清晰地划分出三大处理部分,首先,教务部门人员在测评前要对本次测评所需的基本数据进行准备,即要维护好参与测评的班级、班级的班主任、班级的科目及任课教师等相关信息;其次,组织学生对班主任及任课教师进行测评;最后,领导和教师对测评情况进行查询。

3 数据库的分析与设计

3.1 概念结构分析与设计

概念结构设计是整个数据库设计的关键,通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型。测评系统数据库概念设计的表达工具采用E-R模型,基本过程如下:

1) 按照业务流程分析中划分出的三大处理部分,可以确定主要模块。

教师情况数据维护:对教师(包括班主任及任课教师)的基本信息进行维护;

课程情况数据维护:对课程的基本信息进行维护;

班级情况数据维护:对参与测评班级的基本信息进行维护;

班级科目数据维护:对参与测评班级的所授科目情况进行维护;

系统用户维护:对系统用户的基本信息进行维护;

学生对班主任的测评:学生对本班班主任的教育情况进行测评;

学生对任课教师的测评:学生对本班任课教师的教学情况进行测评。

2) 确定实体集。

在教师情况数据维护中实体集合有:教师;

在课程情况数据维护中实体集合有:课程;

在班级情况数据维护中实体集合有:班级,教师信息;

在班级科目数据维护中实体集合有:班级信息,课程信息,教师信息;

在用户情况数据维护中实体集合有:用户;

在学生对班主任的测评中实体集合有:学生信息,班级信息,教师信息,班主任测评信息;

在学生对任课教师的测评中实体集合有:学生信息,班级信息,课程信息,教师信息,任课教师测评信息。

3) 确定实体集之间的联系。

学生是属于班级的,教师与班级之间可能有两种不同的联系,一是教师担任班级的班主任,二是担任任课教师,一个班级开设有多门课程,每门课程可以有1位或几位任课教师,通过分析不同实体之间的联系,便于设计数据库完整性约束。

4) 确定实体和联系的属性。

按前面分析及系统要实现的功能,可以设计出各个实体及联系的属性。学生是一个比较特殊的实体,从理论分析看,学生是参与测评的主体,系统中应该有这个实体,而从测评系统具体实际出发,测评时只需记录一个学号,不需要学生姓名等其他信息,因此,系统中不设计这个实体。

5) 画出局部E-R图。

分别画出班级选择科目及测评的E-R图,如图2、图3所示。

6) 集成局部E-R模型。

形成全局E-R模型,如图4所示,其中系统用户实体未画出。

3.2 逻辑结构设计

逻辑结构设计的任务就是把概念结构设计阶段设计好的基本E-R图转换为与选用的具体机器上的DBMS产品所支持的数据模型相符合的逻辑结构,并对其进行优化。

1) 将实体与联系转化为表。

在概念结构设计阶段已画出全局E-R模型,现在只要利用范式理论,将实体和联系转化为关系型数据库管理系统中的表,将实体中的属性转化为表中的属性。测评系统所选用的DBMS为Microsoft SQL Server2000,一般可以利用SQL语言来实现数据库、表、属性等的创建,并完成所有表及表之间的实体完整性、参照完整性约束和用户自定义完整性约束。

2) 数据模型的调整与完善。

数据库逻辑设计的结果不是唯一的,可以根据应用需要对设计结构进行适当的修改和调整,以期进一步完善设计,提高应用系统的性能。本测评系统中,学生测评完毕后,领导和教师要频繁统计查询测评结果,因此在表中增加适当的冗余是必要的。

4 结束语

数据库设计是管理信息系统开发过程中非常重要的一个环节,在进行数据库设计时,应该准确了解用户需求,以便设计出符合实际需要的数据库。本人开发的基于Struts框架结构的测评系统已经在学校成功进行了4次测评,在最近的一次测评中,有90个班级近4300名学生参与了测评,同时在线参测学生达400人,查询统计非常及时方便,大大提高了教学管理的效率和水平。系统的实际运行证明,测评系统中数据库的设计是规范的,运行是稳定的、可靠的,完全满足系统的要求。

教育测评概念篇(10)

本文中“新观点”的更准确提法应为“转变的观点”。仔细阅读附表1,不难发现其中的一系列文件显示出美国科学教育研究的连贯与继承、变化与发展。因此在《框架》和NGSS中,都清晰地表述出当今美国在科学教育思想和方法上观点的转变,并在NGSS的附录A中总结为以下7点:

(1)K―12年级的科学教育应反映出科学内在关联的本质。

(2)NGSS的内容是学生的预期表现,而非课程。

(3)NGSS中的科学概念需要从幼儿园到12年级连贯地建构。

(4)NGSS中不仅关注对内容的深入理解,也关注对内容运用的深入理解。

(5)从幼儿园到12年级,科学和工程应集成在NGSS中。

(6)NGSS为将要升人大学、就业和成为公民的学生而设计。

(7)NGSS要与通用核心内容标准 (Common Core State Standards(English Language Arts and Mathematics)英语、艺术与数学)相对应。

本文将逐一对其进行分析,以窥美国科学教育的发展方向和趋势。

观点之一:K―12年级的科学教育应反映出科学内在关联的本质

正如在真实世界中人们所实践和经历的科学一样,K―12年级的科学教育应当反映出科学内在关联的本质,这是NGSS中首要提及的需要转变的观点。

科学内在关联的本质体现在《框架》和NGSS中反复强调的3个维度,即科学与工程实践(science and engineering practice)、跨学科概念(crosscutting concepts),以及学科核心概念(disciplinary core ideas)。《框架》中曾指出:《框架》的设计是为了帮助实现一种科学与工程教育的构想,即学生通过在校期间多年的学习,积极参与科学与工程实践、运用跨领域概念,以加深他们对这些领域核心概念的理解。并指出3个维度就像1根绳索中缠结在一起的3股,应将其看作一个有机结合的系统。

鉴于21世纪科学与工程的重要性,当学生面对科学知识时,需要能意识到要结合情境理解,如科学知识如何获得和运用、科学如何和一系列概念联系起来,以帮助人们深入了解周围的世界。因此,学生的学习成果应包括学生将内容知识运用于实践的能力。实践成为学生联系科学知识和实际的桥梁,也成为建构和使用核心概念的过程。《框架》和NGSS中在设计K―12年级的学习要求时都充分考虑了科学教育中如何将知识与实践相互融合,以体现科学内在关联的本质。反复强调3个维度的关联,并在内容标准中着重体现出来,这点与以往的标准相比,有着非比寻常的意义和教育价值取向。

观点之二:NGSS的内容是学生的预期表现,而非课程

不同于1995年美国课程标准中的表述,用预期表现(performance expectations,关于预期表现的详细内容参见本期专题文章《NGSS中的新模式――预期成果》――编者注)作为NGSS的主要内容,并以贯穿学科和年级的相关主题的组织方式呈现,这是NGSS特有的表达模式,也体现了美国科学教育观点的一种转变。

预期表现是可评估的陈述,说明了学生应知道的和能做的。在附表1中的相关文献中,最早提及预期表现的是由国家评估理事会(National Assessment GoverningBoard)和美国教育部(U.S.Department of Education)于2008年的《2009年国家教育进展评估框架――“科学”》。在这篇文献中定义了4个科学实践,即识别科学原理(Identifying Science Principles)、运用科学原理(Using Science Principles)、运用科学探究(Using Scientific Inquiry)、运用技术设计(Using Technological Design)。并指出这些科学实践可以与科学内容结合起来发展学生的预期成果,而这些预期成果正式发展评测条目的基础。因为评测更关注的是学生的理解,而非记忆,同时科学实践也不是脱离内容的技能,因此无论是对知识、还是技能的评测都需要关注学生如何使用科学知识参与和组织科学实践,即学生如何在科学实践中反映他们对知识、技能的理解和运用。

NGSS不仅发展了科学实践,而且沿用了这种方式将其强调的科学与工程实践、学科核心概念、跨领域概念和评测结合在一起,通过“预期成果”对期望学生能知道的和能做到的进行了描述,且这些描述是可观察、可评测的,以提高标准执行的可操作性,同时与国家评测的要求相一致。

观点之三:NGSS中的科学概念需要从幼儿园到12年级连贯地建构

科学教育标准关注从幼儿园到高中毕业整个阶段的学习(详细内容参见本期专题文章《学习进程与NGSS》――编者注),这似乎是1995年美国科学教育标准中已经呈现的观念和趋势。其实,这一观点转变的核心并不在于年级跨度,而在于“科学概念”和“连贯建构”两个关键词上。这两个关键词的含义体现在以下两个方面。

1 科学概念的选择是有重点、有“优先权”的,且是少数的

从《框架》到NGSS中在学科领域上都选择了物质科学(physical sciences)、生命科学(life sciences)、地球与空间科学(earth and space sciences),以及工程、技术和科学应用(engineering,technology,and applicationsOf science)4个主要领域组织学科概念,并在其中选择少数最为核心的概念展开教学。国际科学院组织(国际科学院组织(InterAcademy Panel,IAP),成立于1993年,共有全世界106个国家的科学院参加,旨在通过各成员科学院间的合作与交流,研究一些重要的国际科技问题,并为决策者的政策制定提供科学依据――作者注)科学教育项目组的专著《科学教育的原则和大概念》中清晰地解释了为何要在K―12年级的科学教育中关注核心科学概念,亦或称为大概念(big ideas)。任何科学领域中都包括很多概念,教学应以哪些能帮助学生理解该领域的重要特征以及对学生终身学习有益的概念为主,而不是对所有科学概念面面俱到。《框架》中也持有同样的观点,并指出这些学科核心概念应能部分或全部满足以下条件:

・在跨越多个科学或工程学科问明显重要的概念或是单一学科中的关键性原理;

・能为理解或研究更复杂的概念和解决问题提供关键工具的概念;

・与学生的兴趣和生活经验相关的概念,或是与需要科学或技术知识解决的社会或个人关心的事件相联系的概念;

・在深度和复杂度水平逐渐增长的各个年级都必须具备可教性和可学性概念。也就是说,这个概念对低年级学生来说是可以学习的,并且该概念具有能维持多年持续调查探索的广度。

因此,NGSS中呈现的学科核心概念在数量上少于之前的《科学素养的基准》和《国家科学教育标准》中所包括的,以体现出“1英寸宽,1英里深”的教育思想。

2 K―12年级的连贯建构体现出对科学教育中对学习进程的关注、研究和运用 学习进程(1earning progression)是21世纪以来科学教育研究的热点问题,它是基于教学经验和研究而形成的对学生学习前进方向的可测试预设。这些预设说明了学生在掌握主要核心概念的进程中的普遍规律和路径。

基于此,《框架》的指导性原则之一就是“理解随着时间发展”,并指出:

要对世界的科学解释形成透彻的理解,学生需要有数年而不是几个星期或几个月时间的持续的机会学习、建构基本概念以及体会这些概念之间的相互联系。这种意义上的发展在学习进程的思路中已经被概念化。如果教育的最终目标是掌握科学学科的核心概念,那么精心设计的学习进程为达到该目标提供了一个可以采取的路线图。这样的学习进程不仅描述了学生对概念的认知是如何日趋成熟的,也描述了学生取得进步所需的教学支撑和经验。

因此,NGSS中体现出的教育的连续性和一致性已不再是空洞的理念和思想,而是落实到具体学习内容、技能培养的过程和细节中。这不仅是观念上的转变,也是科学教育教学策略和方法的进一步变革。

观点之四:NGSS中不仅关注对内容的深入理解,也关注对内容运用的深入理解

早在20世纪80年代,认知科学教就已发现,当学生学习深层知识(deep knowledge)并且清楚在真实世界和实际情况中如何运用这些知识时,知识会在学生头脑中保持得更持久,他们也能够将这些知识运用到更广泛的情境中。同时,对众多领域中专家与新手比较的相关研究结果表明:专家了解其领域的核心原则和理论结构,并且利用他们理解新知识或解决新问题;相反,新手倾向于将不连贯的甚至相互矛盾的知识片段视为孤立的实施,并努力寻找一种方式组织和整合它们。因此,当人们认识到知识的建构性、情境性、复杂性和默会性的时候,也认识到对知识的深入理解与了解其运用的密切相关,无法迁移的知识并不是真正掌握和理解的知识。

《框架》和NGSS中都以核心概念的方式给出了一整套各学科领域的概念,同时给出科学与工程的实践。在NGSS的预期成果中,则将各领域的概念、实践和跨领域的概念结合在一起,这些概念和能力需要学生在高中毕业时应能掌握和达成。因此,对于教师、课程及评测开发者而言,关注的是核心概念,关注的是与核心概念建构相关的实践和运用、理解和迁移。也就是说,核心概念的提出,能够提供一个获取新知识的组织结构,理解这些核心概念并进行科学与工程实践有助于学生今后在高中、大学及大学以后的阶段培养学生更广泛的认知和进行更深层次的科学与工程调查研究。

观点之五:从幼儿园到12年级,科学和工程应集成在NGSS中

将技术和工程整合到科学课程标准中的思想并不是新的思想,在1989年的《为了全体美国人的科学》、1993年和2008年的《科学素养的基准》,以及1996年的《国家科学教育标准》中都包含有科学与技术的内容。尽管有这个多年的努力,在科学课程、评测及科学教师职前教育中,工程、技术与科学内容相比,仍然没有得到同等程度的关注。

NGSS中一个完全不同的观点是:通过在所有年级、所有领域的课堂教学中把工程设计与科学探究视为同等重要,并且在每类主题情境中,与其他学科一样给出工程和技术的核心概念两种方式将工程和技术有机地整合到科学教育体系和结构中。

《框架》中指出世界上主要的挑战需要科学与工程解决,例如清洁能源的效率,预防和治疗疾病,维持事物供给和水源清洁,以及解决由于全球环境变化使社会面临的问题。与此同时,工程和技术给学生提供了通过运用他们正在发展的科学知识解决实际问题的过程深化他们对科学的理解。因此,与原有的《国家科学教育标准》相比,更加鲜明地强调了将功能与技术有机地结合到科学课程中,并指出其作用应与科学同等重要。

观点之六:NGSS为将要升入大学、就业和成为公民的学生而设计

20世纪以来,科学技术的迅速发展带来了社会、经济和文化的迅速变化,新的科学发现、技术突破及重大创新不断涌现。科学技术促进了生产力的发展,为人类在更大范围、更深层次上认识并合理利用自然提供了可能,同时也促进了人类在生产方式、生活方式和思维方式上的变革。

毋庸置疑,科学和科学教育已成为当今所有美国人生活的中心。因为以往的世界从没有像现在这样复杂,这种复杂性使得科学知识对于理解整个世界至关重要。当人们需要理解当前事件、选择和使用技术、或在卫生保健问题上做出非正式决策的时候,理解科学是关键所在。同时,科学也是美国持续改革、领导和创造未来工作的国家能力的中心。对于所有学生,无论他们的未来教育和职业路径是怎样的,都必须为将要升入大学、就业和成为公民而在K12年级阶段经历牢固的科学教育。换言之,科学教育的设计必须为他们的将来做好准备。

观点之七:NGSS要与英语、数学通用核心内容标准相对应

NGSS之际正是《英语和数学通用核心内容标准》(CCSS)实施之际,这给科学成为儿童综合教育(comprehensive education)的一部分成为可能,也是的NGSS在内容和要求上呈现出与CCSS相互对照的特点。这种对照不仅确保了所有内容领域学习的系统性,也使得它成为NGSS尤其与众不同之处。

NGSS的附录A中,以上述7条阐述其在科学教育观点上的变化,包括涉及科学课程本身、科学与工程技术,以及科学与数学和语言学科等方面。NGSS不仅关注核心概念,关注实践,关注科学、技术、工程与数学,更关注理解、运用、和各维度的整合。其实这些变化并非突变,在2007年的《将科学带进学校》一书问世以来,美国的科学教育已经进入一个反思过去、将科学研究带入科学教育、用实证科学研究指导教育政策和教学实施的时代。

参考文献

[1](美国新一代科学教育标准官方网站)

上一篇: 加强企业信息化建设的建议 下一篇: 会计信息质量的作用
相关精选
相关期刊