当前位置：科普教育 > 教育综合基础知识 > 第十章学习测评

第十章学习测评

　　历年考题分析

　　考情分析：

　　从近五年的考试分数分布表可以发现，从分值来看，考试分值在整个试卷中的一直非常低，2010年为1.5分，2011年和2012年仅为1分，2013年为0分，2014年为1分。从考试题型来看，四种主观题型在本章均没有出现过，仅出现过选择题。从本章内容及考试分布来看，本章属于次要章节。具体来说：

　　选择题。2010年出现两道选择题，分别考查考生对信度定义、形成性评价与总结性评价的区分等内容的掌握；2011年则考查考生对效度定义的掌握；2012年考查难度在不同取值范围的含义；2013年没有出现选择题；2014年以计算机等级考试属于何种评价类型的形式来考查考生对几种测量与评价类型的区分。

　　主观题。简答题、判断分析题、论述题和材料分析题在五年中均没有出现。

　　应考攻略：

　　从上面的分析中我们可以看出，本章内容属于次要章节，应减少时间和精力分配在该章的知识点上。在复习应考过程中，主要针对选择题的知识点来加以备考，特别应牢牢把握测量与评价的类型、各种类型测量与评价的定义、有效测验所具备的几个必要条件等常考知识点。

　　本章典型过关习题

　　一、单项选择题

　　1.一个测验能够测量出所要测量的东西的程度称为（）

　　A。效度

　　B。信度

　　C。难度

　　D。区分度

　　2.由特定团体的相对标准决定最终成绩的测验是（）

　　A。常模参照测验

　　B。标准参照测验

　　C。团体测验

　　D。个体测验

　　3.就一个测验的优劣而言，最为重要的是（）

　　A。效度

　　B。信度

　　C。难度

　　D。区分度

　　4.在实际的教学中，教师通常会在一门课程结束后进行考试或测验，以评价学生对知识和技能的掌握程度。这种评价方式被称为（）

　　A。诊断性评价

　　B。配置性评价

　　C。形成性评价

　　D。总结性评价

　　5.在学生学业成绩测验中，有一种适用于大规模范围内评定个体学业成就水平，用来判断学生与常模相比时所处水平的测验被称为（）

　　A。教师自编测验

　　B。目标参照测验

　　C。标准化成就测验

　　D。定向反映测验

　　6.为了摸清学生的现有水平及个别差异并便于安排教学，一般在教学开始前使用（）

　　A。诊断性评价

　　B。配置性评价

　　C。形成性评价

　　D。总结性评价

　　7.在一个测验正式付诸使用以前，测验的编制者都要建立一个解释测验结果的参照指标，使得对分数的解释更加清晰、明确。这一参照指标指的是（）

　　A。常模

　　B。效度

　　C。难度

　　D。信度

　　8.在布卢姆的教育目标分类中，认知领域的最高目标层次是（）

　　A。知识

　　B。理解

　　C。应用

　　D。评价

　　9.在教育领域，从多种角度以多种方法去评估一个人的知识或能力，以作为教学或辅导效果的证明或依据。这指的是（）

　　A。测验

　　B。测量

　　C。测评

　　D。评价

　　10.若按测量与评价的对象来划分，可以将“瑞文推理测验”归类于（）

　　A。智力测量与评价

　　B。能力倾向测量与评价

　　C。成就测量与评价

　　D。人格测量与评价

　　11.测量与评价的目的不在测量与评价被试能力的高低，而是要求被试按通常的习惯方式做出反应。这种测量与评价属于（）

　　A。形成性测量与评价

　　B。常模参照测量与评价

　　C。典型行为测量与评价

　　D。最佳行为测量与评价

　　12.在效标的选择与效标测量中，应当防止出现（）

　　A。效标污染

　　B。表面效度

　　C。内容效度

　　D。结构效度

　　13.测验给被试或一般人的印象“好像”是在测量某种特质，而不是指测验事实上能测量到什么特质。这种效度被称之为（）

　　A。效标污染

　　B。表面效度

　　C。内容效度

　　D。结构效度

　　14.一般来说，教师自编测验的信度系数至少应该大于（）

　　A。0.2

　　B。0.4

　　C。0.5

　　D。0.6

　　15.经典测验理论的信度系数主要有三类，下列选项中不正确的是（）

　　A。重测信度

　　B。复本信度

　　C。内部一致性系数

　　D。稳定系数

　　16.分析有价值的活动内涵、归纳出推论的价值概念、建立起个人的内在化价值观念、发展个人的价值体系、并维持价值体系间的一致性和次序性等能力，这在布卢姆的情感领域中属于（）

　　A。评价

　　B。内化

　　C。反应

　　D。重组

　　17.测量与评价有诊断学习的作用，下列选项属于诊断学习作用的是（）

　　A。激励学生的学习动机

　　B。帮助学生的记忆和促进迁移

　　C。促进学生自我评价

　　D。补救教学

　　18.将项目区别被试水平的能力的量度称之为（）

　　A。效度

　　B。信度

　　C。难度

　　D。区分度

　　19.1965年，美国测验专家R。L。Ebel根据长期经验提出用鉴别指数评价题目性能的标准，并认为评价为优良的区分度值应为（）

　　A。0.40以上

　　B。0.30-0.39

　　C。0.20-0.29

　　D。0.19以下

　　20.试题的实证审查是指通过对获得的测试数据进行量化分析，以判定试题品质的好坏。实证审查一般不包括试题的（）分析

　　A。难度

　　B。区分度

　　C。信效度

　　D。教学敏感度

　　21.下列选项中不属于标准化成就测验优越性的是（）

　　A。客观性

　　B。计划性

　　C。可比性

　　D。公开性

　　22.标准化成就测验是指由专家或学者们所编制的适用于大规模内评定个体的（）测验。

　　A学业成就水平B。能力形成C。结构D。智力发展

　　23.目前标准化的学业成就测验与学校课程之间关系（）

　　A。比较紧密

　　B。乏学业效度

　　C。很不协调

　　D。基本协调

　　24.标准化测验的最新发展趋势是（）

　　A。常模参照测验

　　B。计算机适应性测验

　　C。标准参照测验

　　D。非正式测验

　　25.采用智力测验对某一儿童进行测量，发现在一个月后的测验结果与六个月前和三个月前的得分大致相等，这表明该智力测验具有较高的（）

　　A。效度

　　B。信度

　　C。区分度

　　D。相关

　　26.韦氏智力测验除了有总智商分数，还提供了言语理解、知觉推理、工作记忆和加工速度四个指数。韦氏智力测验（第4版）的中文版修订是由我国心理学家（）主持完成的。

　　A。林传鼎和张厚粲

　　B。林传鼎

　　C。张厚粲

　　D。陆志韦

　　27.关于测验的信度和效度的关系，以下表述不正确的是（）

　　A。信度是效度的必要条件

　　B。效度是信度的充分条件

　　C。高的信度一定有高的效度

　　D。高的效度一定有高的信度

　　28.计算内部一致性系数的主要方法有很多，但不包括（）

　　A。KR20公式

　　B。克龙巴赫α系数

　　C。荷伊特信度

　　D。积差相关系数

　　29.试题的逻辑审查，主要审查试题的适当性和（）

　　A。恰当性

　　B。一致性

　　C。准确性

　　D。合理性

　　30.下列关于教学评价与测量及测验的关系，说法不正确的是（）

　　A。两者既有联系又有区别

　　B。两者完全等同

　　C。教学评价以测量、测验的客观描述为基础

　　D。测量、测验的结果通过教学评价才能判断是否有实际意义

　　二、简答题

　　1.测量与评价的功能。

　　2.标准化测验的优点与劣势。

　　三、判断分析题

　　1.学生在某学科的期中和期末测验中，两次考试所取得的成绩前后波动很大，这说明测验的信度很低。

　　2.凡是以能力的高低作为评价基础的测量，都属于最佳行为测量。

　　本章典型过关习题详解

　　一、单项选择题

　　1.A“详解”效度是指测量的正确性和有效性，即一个测验能够测量出所要测量的东西的程度。

　　2.A“详解”该题考查的是常模参照测验的定义

　　3.A“详解”一个测验最重要的是能测量出其想要测量的东西。

　　4.D“详解”在期末或一门课程结束后进行的考试或评价称之为总结性评价。

　　5.C“详解”在学生学业成绩测验中，有一种适用于大规模范围内评定个体学业成就水平，用来判断学生与常模相比时所处水平的测验被称为标准化成就测验。

　　6.B“详解”配置性评价一般在教学开始前使用，且目的是为摸清学生的水平和个体差异并据此安排教学；诊断性评价有时与配置性评价意义相当，但有时指对经常表现学习困难的学生所做的评价。

　　7.A“详解”一般来说，常模是指测验时的参照指标，建立在测验之前。

　　8.D“详解”布卢姆将认知领域的学习分为知识、理解、应用、分析、综合、评价六个层次。这六个层次由低到高，每一项都建立在先前获得的技能基础之上。

　　9.D“详解”该题考查的是评价的定义。

　　10.A“详解”该题四个选项均属于根据测量与评价的对象进行分类的具体类型。智力测量与评价目的在于测量并评价个人智力水平的高低。包括智力测验有“斯坦福——比纳量表”、“韦克斯勒智力量表”、“瑞文推理测验”等等。

　　11.C“详解”典型行为测量与评价的目的不在测量与评价被试能力的高低，而是测量与评价其是否具备某种（或某些）典型行为。即典型行为测量与评价所关心的不是被试能不能尽其所能地表现出其最佳水平，而是要求被试按通常的习惯方式做出反应（即典型行为）。如态度、情感、人格、兴趣测量等等，都属于典型行为测量。这些测量过程，希望被试以其平常的典型状况来回答，无所谓正确与错误之分。

　　12.A“详解”选择效标和效标测量时，要注意防止效标污染，即效标评定受到评定者知道测验分数的“污染”。例如，一位老师知道某学生在一个能力倾向测验上得分很低，这类消息可能会影响他对该学生的成绩评定。出于这种原因，“对测验分数进行检验”时，使用的测验分数必须严格保密。

　　13.B“详解”表面效度是指测验给被试或一般人的印象“好像”是在测量某种特质，而不是指测验事实上能测量到什么特质。表面效度的存在，有时可以激励学生认真作答，表现接受测验的合作意愿，因为它“看起来”像是在测量某种特质，比较容易吸引人注意。但是，表面效度并不是真正的效度，它不可以用来从内容代表性的角度来检验测验效度。

　　14.D“详解”一般而言，测验信度越高越好。教师自编测验一般来说信度为低一些，但信度系数至少应在0.60以上。

　　15.D“详解”经典测验理论的信度系数主要有重测信度、复本信度、内部一致性系数三类，另外，分半信度可以和复本信度一样解释，即可以把对等的两半测验看成是在最短时距内施测的两个平行测验。又由于分半信度描述的是两半题目间的一致性，所以它有时也被看作是内部一致性系数。

　　16.D“详解”情感领域的教学目标依次可以分为接受、反应、评价、重组和内化五个层次，该题考查的是重组的定义。

　　17.D“详解”测量与评价促进学生学习有两个方面的作用，一是诊断学习，二是帮助学习。该题的前三个选项都是帮助学习方面的作用。

　　18.D“详解”该题考查的是区分度的定义。

　　19.A“详解”1965年，美国测验专家R。L。Ebel根据长期经验提出用鉴别指数评价题目性能的标准为：区分度值0.40以上评价为优良；0.30-0.39评价为合格；0.20-0.29评价为尚可，需修改；0.19以下评价为应淘汰。

　　20.C“详解”教师命制的题目组成试卷之前，应对试题进行必要的审查，这可以分成两个方面来进行：逻辑的审查和实证的审查。实证的审查是指通过对获得的测试数据进行量化分析，以判定试题品质的好坏。主要包括试题的难度和区分度分析，以及教学敏感度分析。

　　21.D“详解”标准化测验的优点主要有客观性、计划性和可比性。

　　22.A“详解”该题考查的是标准化成就测验的定义。这种测验的命题、施测、评分和解释，都有一定的标准或规定。

　　23.C“详解”对标准化测验的批评包括两个，一是与学校课程之间的关系很不协调，二是测验结果的不当使用，我们通常利用标准化成就和能力测验对学生分类和贴标签，对个体造成了不良影响。

　　24.B“详解”计算机化的适应性测验是标准化测验的最新发展趋势，它是运用最先进的信息技术来改革测验工具和模式的尝试。

　　25.B“详解”信度是指一种测验多次测量所获得分数的稳定性、一致性程度，它反映的是测验的可靠性。题干中所描述的是前后几次测验结果都相当，正符合信度的定义。

　　26.C“详解”韦氏智力量表是美国韦克斯勒于1955年主持编制的系列智力测验量表，是目前世界上应用最广泛的智力测验量表。该量表于1981年由湖南医科大学龚耀先教授等主持修订。林传鼎和张厚粲在20世纪80年代初主持了韦氏儿童智力测验中文版（WISKR）的修订版。张厚粲在2007年主持完成了韦氏智力测验（第4版）的中文版修订，量表除了有总智商分数，还提供了言语理解、知觉推理、工作记忆和加工速度四个指数。

　　27.C“详解”效度和信度是相辅相成的，效度是信度的充分条件，信度是效度的必要条件。效度高的测验必然具有高信度，但信度高的未必测验一定有效。总之，一个良好的测验，必须同时具备高效度和高信度两个指标。

　　28.D“详解”内部一致性系数也叫同质性信度，是指测验内部所有题目间的一致性程度，主要的计算方法有KR20公式、KR21公式、克龙巴赫α系数，以及荷伊特信度等。

　　29.B“详解”教师命制的题目组成试卷之前，应对试题时行必要的审查，包括逻辑的审查和实证的审查。其中逻辑的审查，主要是审查测验试题是否具有一致性和适当性，以确保测验试题都能测量所要测量的教学目标。一致性的重点在于试题是否与教学目标一致、与教学的呈现方式一致、是否能代表所要测验的行为目标等。

　　30.B“详解”教学测量与评价两者既有区别，又有密切的联系。一方面，教学测量时对学绩测验所得结果的客观描述，并不考虑结果的实际意义。而教学评价则是对学绩测验所得结果的主观判断（对结果进行解释），以了解结果的实际意义。另一方面，虽然教学评价是一种主观判断，但是这种主观判断必须以教学测量所得的客观描述为依据，否则就是主观主义的判断。同样，教学测量只有通过教学评价才能体现这种客观描述的实际意义。

　　二、简答题

　　1.测量与评价的功能。

　　“答案要点”

　　①提供反馈；②提供信息；③激励学生；④衡量教学效果。

　　2.标准化测验的优点与劣势。

　　“答案要点”

　　（1）标准化测验的优点。

　　①客观性；②计划性；③可比性。

　　（2）标准化测验的劣势。

　　①不能促进学习；②使用条件非常严格，难以预测个体情况；③未必真正公平。

　　三、判断分析题

　　“答案要点”

　　1.错误。信度定义所指的是针对同一批被试参与同一套测试题而言的，期中和期末两次考试在现有的学校教育体系中，一般不太可能考同一套试题，因此与信度关系不大。

　　2.正确。以测量与评价对被试行为表现的要求来分类，可以将测量与评价分为最佳行为测量和典型行为测量。其中最佳行为测量是以测量被试的最佳行为表现为目的的，而典型行为测量的目的是测量与评价被试是否具备某种或某些典型行为。因此，凡是以能力的高低作为评价基础的，都属于最佳行为测量与评价。

　　

更多 编辑推荐: 1中国股民、基民常备手册; 2拿起来就放不下的60...; 3青少年不可不知的10...; 4章泽; 5周秦汉唐文明简本; 6从日记到作文; 7西安古镇; 8共产国际和中国革命的关系; 9历史上最具影响力的伦...; 10西安文物考古研究（下）

看过本书的人还看过

西安文物考古研究上）

作者：西安文物保护考古所　

科普教育 【已完结】

本书共收入论文41篇，分7个栏目，即考古学探索、文物研究、古史探微、遗址调查报告、地方史研究、文物保护修复技术、文物管理工作。
浙江抗战损失初步研究

作者：袁成毅　

科普教育 【已完结】

Preface Scholars could wish that American students and the public at large were more familiar...
中国古代皇家礼仪

作者：孙福喜　

科普教育 【已完结】

本书内容包括尊君肃臣话朝仪；演军用兵礼仪；尊长敬老礼仪；尊崇备至的皇亲国戚礼仪；任官礼仪；交聘礼仪等十个部分。
中国古代丧葬习俗

作者：周苏平　

科普教育 【已完结】

该书勾勒了古代丧葬习俗的主要内容，包括繁缛的丧仪、丧服与守孝、追悼亡灵的祭祀、等级鲜明的墓葬制度、形形色色的安葬方式等九部分内容。