首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 442 毫秒
1.
主观考试采用评分员进行主观评分,由于评分一致性不高,缺乏信度,测量学界一直在努力探索提高主观评分信度的办法。本文用Longford方法对参加HSK[高等]作文考试评分的异常评分员作了一次实证检验。结果证明,该方法对检验大规模标准化主观考试评分员差异确实有效。  相似文献   

2.
信度是衡量测量结果稳定性与可靠性的重要指标,反映了测量过程中对误差控制能力的大小。信度分析是自学考试试题评价的重要内容,包括测量分数信度分析与及格线决策信度分析。本文简要介绍了CTT信度观、GT信度观及IRT信度观的理论内容与信度分析方法,并对三种测量信度观进行比较。本文提出,自学考试的信度分析工作应结合具体课程的考试特点、试卷结构、考试作答数据类型等因素,同时考虑CTT、GT、IRT三种信度观的优势及信度估计方法的应用条件,根据具体研究目的选择最恰当的或综合运用不同的信度分析方法。  相似文献   

3.
概化理论作为新一代测量理论逐渐应用于大规模考试领域。文章运用多元概化理论对自学考试课程《英语水平考试(一)笔试》试卷的测量信度、试卷总分合成、及格线决策信度、试卷结构优化等问题进行探讨。研究发现:本次考试的测量信度较高;各分测验对全域总分的方差贡献比例与试卷赋分意图基本一致;该试卷以60分作为及格线具有较高的决策信度;将各分测验题量同时增至15题或单独将词汇分测验题量增至20题,可有效提高测量信度。  相似文献   

4.
旨在综合应用现代测量理论分析我国现有初中学业水平考试中固定分数法标准设定的信度指标。采用分层随机取样设计,分别从我国东中西部地区各选择一个区县,并分别从中随机抽取初三学生3000名,对被试的数学学业水平考试的数据进行分析。综合应用现代测量理论分析学业水平考试标准设定的信度指标,包括经典测量理论的决策一致性系数(kappa)、概化理论的等级线决策信度Φ_λ和项目反应理论的信息量I_θ。研究结果显示,固定比例法标准设定下,决策信度处于0.7左右;等级线决策信度大于0.7,大部分在0.8左右;分界点的信息量大部分低于16。这些结果说明,我国现有的学业水平考试标准设定质量一般,对于毕业和升学的高利害性考试来说需要进一步提高。  相似文献   

5.
完形填空是英语专业四级考试的一种题型,其目的是测量考生的综合语言知识和技能。自2004年新大纲实施以来,完形填空在题量上发生了变化,由原来的15个空增至20个空。但它是否就具有较高的信度?本文采用复本测试法对两篇新版英语专业四级考试完形填空的信度进行了检验。从试验的结果来看,这两篇英语专业四级考试完形填空的信度仍有待提高。  相似文献   

6.
测验信度大盘点   总被引:1,自引:0,他引:1  
信度是对测量一致性程度的估计。信度分成再测信度、复本信度、同质信度、评分者信度等四种类型。测验的长度与难度以及被试团体的变异性与能力水平是影响信度的主要因素。测量标准误差属另类信度,可用于解释个体分数或解释分数差异。估计速度测验和掌握测验的信度,需使用特殊的方法。  相似文献   

7.
期末考试试卷质量分析   总被引:1,自引:0,他引:1  
本文利用教育测量与统计分析理论,结合数学系04级数学与应用数学专业第一学期几何考试情况对试卷的难度、区分度、效度、信度等指标进行定量化分析,统计分析表明:本次考试基本上反映了学生的实际学习情况。试卷结构比较合理,评卷也很公正。  相似文献   

8.
学业成绩考试的信度分析   总被引:1,自引:0,他引:1  
考试信度对于任何一种有效考试来说都是必不可少的,只有信度高的考试才能使教师对学生的评价客观、可靠,考试成绩才能正确地反映被试者的程度。教育测量学、教育统计学在理论上为考试的科学化和现代化奠定了基础,使得考试分析数量化,而SPSS社科统计软件又使广大教师使用计算机进行学业成绩考试信度的定量分析成为可能。  相似文献   

9.
张媛  张兰芳  朱新华 《文教资料》2009,(23):205-207
长期以来,教育测量对于客观题部分的信度系数测量有很多方法,并且越来越精确,但是对论文式测验的信度系数测量却没有太多改进,由于对评分者信度的忽视导致了对论文式测验信度测量的误差.文章首先分析了对论文式信度系数的测量方法及评分者信度系数的计算方法,然后在指出这种误差的基础上分析了错误的原因,并提出了相对完善的公式,最后介绍了相应的信度估计方法.  相似文献   

10.
概化理论(GT)提出了新的测量信度观并逐渐应用于大规模考试领域。本文将概化理论思想与方法引入自学考试信度分析研究与实践,提出了自学考试信度分析的概化理论研究框架。本框架对自学考试信度分析的基本任务与流程进行了梳理与总结,对一元概化理论(UGT)模型与多元概化理论(MGT)模型的应用进行了整合,选择了更为合理的自学考试信度指标并探讨了及格线决策信度的考察思路,为自学考试研究者进行概化理论研究提供一定程度的参考。  相似文献   

11.
信度是英语“reliability”一词的中文翻译,在应用概率论、工程和军事等领域里把这个英语词翻译成“可靠度”。考试的信度是指考试测量学生语言能力一致性的程度,即考试结果不受考试施考时间、监考人员、考试场地等因素的影响。例如,对于一个信度较高的考试,无论考生何时参加考试,周一还是周二;无论由谁来监考,赵老师还是钱老师;也无论在哪里考试,是甲地还是乙地,其所得分数在理论上应该一致,在实际中应相差不大,这些都是与信度有关的重要问题。  相似文献   

12.
关于语言测试效度与信度的论证由来已久,莫衷一是。一方面,教师和学生对我国现行的英语水平考试在效度与信度的权重取向中偏向信度,从而导致人们对学生高分低能的现象大加责难;另一方面,教师和学生在教学和学习过程中急功近利,为考试而学习,为考试而考试,忽视学生真实语言水平和语言能力的培养,忽视考试的效度,这两种态度均不可取。从信度与效度的角度出发,结合我国现行的英语测试形式论述该如何选取英语测试形式。  相似文献   

13.
王显涛 《文教资料》2016,(4):173-174
大学英语口语考试的信度和效度受到很多学者关注,但是作为一种应用在一般教学环境中的小组讨论形式的测试,对于其中评分员信度的研究,目前相关的研究成果还不多见。本文对小组讨论形式的大学英语口语考试中评分员信度进行实证研究,并描述和讨论相关的数据与研究结果。  相似文献   

14.
本文通过真实分数,考试分数及误差的关系来揭示对信度的影响,并深入探讨了产生误差的来源,从而分析如何提高考试的信度。  相似文献   

15.
杨华  沈丽坤 《文教资料》2010,(30):122-123
信度和效度是测试学中衡量考试质量的两个重要标准。本文在介绍考试信度与效度概念的基础上,着重论述了二者之间的辩证关系,以指导测试者正确地把握和衡量,达到二者最佳的平衡。  相似文献   

16.
语言测试研究是应用语言学的一个分支,信度和效度是语言测试领域中的两个重要概念.信度指的是考试结果的可靠性;效度指的是考试达到预定目的的程度.本文介绍了信度和效度的定义、测量方法、影响因素,并指出了语言测试中二者的相互关系是既相互依存,又相互排斥的关系.  相似文献   

17.
陈畅 《考试研究》2008,(4):91-101
高考考生作答试卷主观感受问卷是命题效度研究中收集资料的重要工具。本文以考生对试题难度、抽样水平的主观感受以及作答时的心理焦虑程度等三个因素为标准编制问卷,并在某市高考考生中进行调查,对调查结果进行验证性因素分析。分析结果表明,该问卷是一个具有较好信度和效度的测量工具,可以为高考命题的效度研究提供一定的依据。  相似文献   

18.
大学英语四级考试是一项能力测试。在能力测试中,信度和效度是评估大学四级考试的两个主要标准。测试的成功与否,在很大程度上取决于这两个标准的高低,因而应力争提高其测试的信度与效度。分析改革后四级考试听力部分的信度和效度对大学英语听力教学也有一定的指导意义。  相似文献   

19.
中小学生汉语考试,是面向第一语言非汉语的中小学生汉语学习者的国际性考试。该考试共分为三级。本文以中小学生汉语考试(二级)的实测数据为研究对象基础,讨论了中小学生汉语考试(二级)的信度与效度问题。研究结果表明,中小学生汉语考试(二级)的题目质量较好,难度控制理想,试卷结构合理,信度较高。  相似文献   

20.
口语测试直接探测考生语言表现,考试主观性强,信度不高。本文结合测试构念、信息馈入与输出、考试形式、评分等口语考试环节,从信度、效度等质量指标入手,探讨构建科学口语评估体系的可行性做法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号