首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
二 效度的控制 效度是反映测验准确性、有效性的指标。效度的高低主要受条件误差(或称系统误差)的影响。反过来,效度的高低也说明测验存在的条件误差的大小。 教育测验,根据其目的,首先要确定测量被试者应具备哪些知识、能力、素质。比如说,考司机应该考驾车技术如何,是否懂得交通规则,汽车出了故障能否排除等,而不应该考木工活做得怎样。这个问题看起来很简单,在实践中却经常不同程度地出现这方面的问题。我国封建社会的科举考试,目的是为了选拔  相似文献   

2.
效度是衡量考试科学性的重要指标,反映考试在多大程度上实现了测量目的;效度验证也成为测验开发的重要环节,用以支持分数解释及测验使用。本文简要介绍了效度概念的内涵及效度验证的发展历程,并尝试将效度整体观引入自学考试领域,对自学考试的效度验证及其证据来源进行初步探索。本文提出,自学考试应从命题管理的各个环节系统地收集证据进行效度验证,效度证据的来源包括测验内容、反应过程、测验内部结构、测验评分、跟外部变量的关系、测验后果等多个方面。  相似文献   

3.
教育测验服务中心正在讨论对于已经实习的教师是否通过测验才能鉴定其真正称职。最近,在一次阻止美国高校出题负责人认为误用了国家教师考核的风波后,教育测验服务中心不得不做出决定:禁止任何州或学区采用这种方式进行考试。今年秋季,阿肯色州首先宣布计划运用这类考试来鉴定授课教师。法律规定:从1987年开始,所有的教师必须通过一次高校技能测验,才能使其证书获得承认。教育测验服务中心强烈反对这条新法律,除了对准备从事教学的学生外,自己也尽力避免使用这类考  相似文献   

4.
一份好的数学试卷,必须具有较高的效度。效度是衡量一次数学测验结果有效性的重要指标,它是指测验结果的有效性程度,一份低效度的数学试卷是没有什么价值的。影响数学测验结果效度的因素很多,因此,我们在编制一份数学试题时,应该考虑到这些因索,尽量避免这些因素对测验结果有效性的影响。  相似文献   

5.
测验长度(test length)是影响语言测试信度和效度的重要因素之一。本文借助概化理论(Generalizability Theory,GT)的固定侧面s×(i:p)嵌套设计和边际效用递减法则(the Law of Diminishing Marginal Utility),对中国汉语水平考试(HSK[中级])的测验长度进行了实证研究。研究结果显示:由130题构成的HSK[中级]测验具有相当高的测验信度,概化系数(Eρ2)可达0.8890,即使将测验的题目数量减少至120题或110题,测验的概化系数仍可以达到0.8856和0.8816(分别降低了0.38%和0.83%),这种测验长度的缩减不仅明显地降低了研发成本,而且提高了测试效率,完全能够满足标准化考试在误差控制方面的较高要求,并确保测验结果和分数解释具有较高的信度和效度。  相似文献   

6.
中共中央关于教育体制改革的决定中指出:教育体制改革的根本目的是多出人才,出好人才.基于这样的指导思想,我们对高中语文考试方法进行了一点改革,我们认为:现行的考试制度、考试方法存在着许多弊端.第一,现行的考试制度不利于人才的培养.学生从上小学到大学毕业,十六七年的学校生活,基本上是在考试中度过的.小测验、大测验、随堂考、单元考、阶段考、期中考、期末考、统考、汇考、摸拟考等等,名目繁多的频繁考试,只能培养学生的"应试"能力,完全背离了学生智力  相似文献   

7.
1985年《教育与心理测验标准》(第5版)出版之前,效度研究的核心概念是"效标(criterion)",效度研究被视为一种用"效标"对测验的效度进行证明(verify)、对测验分数做出有效(valid)解释的过程。1985年以后,效度研究的核心概念是"证据(evidence)",效度研究被视为一种通过积累证据对测验的效度进行支持(support)、对测验分数做出合理(reasonable)解释的过程。关于效度的这种理解,突出体现在1999年出版的《教育与心理测验标准》(第6版)中。美国教育协会和美国国家教育测量学会共同组织编写的《教育测量》在业内被称为"教育测量领域的《圣经》"。2006年《教育测量》(第4版)出版以后,效度研究的核心概念演变为"理由(warrant)",效度研究被视为一种通过构造"理由系统"和"理由网络"对效度进行"论证(argument)"、对测验分数做出可接受的(plausible)解释的过程。本文结合笔者的考试实践,介绍了效度概念的新发展。  相似文献   

8.
在教育与心理测验中,我们必须对测验工具(编制的测验题)的有效性和可靠性进行考验,这就需要计算测验工具(或测验题)的效度和信度。一、效度效度是测量有效性的捐标。它表示某项测验能正确测出学生知识水平和智能水平的程度。一套试题,只有在合乎某个特定的目的限度内才是有效的,测验的效度与评定的目的是密切相关的,测验的效度与评定丢掉了或偏离了这个目的,就无效度可言。效度有若干不同类型,一个好的测验可以用一种  相似文献   

9.
英语高考试行"一年多考"是一项了不起的进步,但多次考试之间的难度波动往往会给直接使用原始分数做招生决定带来极大的麻烦。本文探讨了稳定测验难度的三种方法:国际考试行业的标准做法、借用标准设定思想的专家评定方法,以及反向使用效度证据的小规模代表性样本试测方法。期待这些方法可以给考试一线工作者提供更多的选择。  相似文献   

10.
一、命题指导思想高考命题是考试科学、公正的重要环节,必须保证试卷达到教育测量基本要求的指标,即较高的信度和效度,试题具有适宜的难度和区分度。考什么?对中学教学影响很大,也对大学新生的知识结构及其相关的素  相似文献   

11.
本文从教育与心理测量学、教育统计学以及教育心理学的角度出发,就教育测验的效度问题系统地论述了:1.教育测验效度是内容效度、效标关联效度和构想效度的统一;2.教育测验的效度重心及其转移,不同类型的教育测验应有不同的效度重心;3.教育测验效度的检验方法;4.教育测验的系统控制等四个问题。  相似文献   

12.
2008年中考语文试卷结构稳定,稳中有新,稳中有变。试卷难易比例恰当,具有较高的信度和效度及有效的区分度,达到了考能力、考基础、考素质、考潜能的考试目的。  相似文献   

13.
运用现代教育测量理论,对数学测验进行标准化控制,以提高考试的效度和信度,尽而实现数学教育测量的标准化、科学化.其一般原则也适合于其他学科测验,并给出与考试有关的几个问题.  相似文献   

14.
在大规模、标准化语言测验中,如何确保复本测验分数之间具有等价性和稳定性的问题,是测验分数信度高低的重要标志之一,也是测验结果解释和分数使用效度高低的重要证据之一.本文在对汉语水平考试(HSK)标准化开发程序和等值处理技术进行考察的基础上,重点对国内最近两年HSK考试使用的8份复本测验分数之间的稳定进行了统计分析.结果表明,HSK测验的复本分数之间具有较高横向稳定性,所有测验试卷的分数与标准卷均具有历时一致性.  相似文献   

15.
全国计算机技术与软件专业技术资格(水平)考试属于目标参考性测验,但又具有常模参考性测验的特点,以此为出发点,本文从测量误差模型出发,分析并提出了一套计算机软件考试的质量评价指标,这些指标包括测验效度、信度、难度、区分度等,并以经典测验理论为基础,提出了一套有效的、可操作的计算方法。质量评价结果对于指导命题、改进教学、完善考试大纲、合理评价人才具有重要意义。  相似文献   

16.
本文旨在通过定量分析来检验广东省高考英语(NMET)Ⅱ计算机化口语考试的构念效度问题,即这一考试(COT)是否考到了它所要考的构念.通过定量分析.包括内部相关、外部相关的分析和因子分析等方法证明,COT考的是一个独立的构念,而且这一构念就是口语交际能力,因此我们得出COT有比较高的构念效度.  相似文献   

17.
化学     
一、总体评价 (一)命题指导思想高考既要有利于高校选拔新生,又要有利于中学素质教育。高考命题是考试科学、公正的重要环节.必需保证试卷达到教育测量基本要求的指标,即较高的信度和效度,试题具有适宜的难度和区分度。考什么?对中学教学影响很大,也对大学新生的知识结构及其相关的  相似文献   

18.
进入高三化学总复习后,阶段性的单元测验、模拟考试是检测学生知识和能力水平的一个重要手段.通过测验可以了解到教与学的薄弱环节,以便教师能及时采取相应的补救措施.对于这类考试而言,学生的“考”只是一个前奏,而真正考试目的的实现在于考试结束后的“评”.因而试卷讲评课应看作是这类考试的延续,讲评课的质量将直接影响到考试的效果和总复习的质量.  相似文献   

19.
近年来,上海市高考历史试卷令人耳目一新:测验内容知能并举,测验技巧多样灵活,测验格式丰富多彩,等等。尽管存在些许争议,但毕竟“瑕不掩瑜,”大多数教师和学生积极认可并给予良性评价。高考历史试卷的系列变化,贯穿着这样一条主线:降低知识要求,增强能力考核,突出历史思维,强化历史意识。为了促使该学科考试渐次步入科学化设计的轨道,本文将从认知角度,着重回答——历史考试要考什么?达到什么目的?怎样考?——这三个问题,以期探析教育心理学思想在高中历史考试中所起的作用。一、考核内容历史考试要考什么?一般地讲,考试内容要尽可能反映学…  相似文献   

20.
<正> 标准化考试是二十世纪初在西方,首先是在美国,随着当时所谓“教育科学化运动”而发展起来的一种考试形式。当前,它在国际上极为流行。标准化考试,要求试题和试卷的标准化,要求整个测验。符合考试目的;每道试题和整张试卷,都难度恰当,区分能力强;施测结果,有高的信度和效度。它要求施测与记分过程的标准化,分数的标准化,从严格意义上讲,还一定要取得常模,编制评分量表。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号