首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 390 毫秒
1.
概化理论提出了新的测量信度观并逐渐应用于大规模考试领域。本文运用多元概化理论对高等教育自学考试课程《综合英语(四)》听力测验的测量信度、测验总分合成、题型设计优化等问题进行探讨。研究发现:本次听力测验的总体测量信度较高,但"短文理解"分测验的测量信度较低;各分测验对全域总分的方差贡献比例与测验编制时的赋分比例存在一定差距;在删除"短文理解"分测验后将各分测验题量同时增至10题,可有效提高听力测验的测量信度。  相似文献   

2.
本研究主要分析了概化理论与经典测量理论、方差分析之间关系 ,论述了概化理论的优势与特色。运用概化理论分析《超常儿童心理发展与教育》课程成绩的评估数据 ,结果表明 ,评分者之间具有较高的一致性 ,并考察了评分者人数的改变对测量信度的影响。  相似文献   

3.
本文对概化理论的分析思路进行程序化总结,介绍其主要步骤,即明确概化理论的研究设计、确定数据结构和概化模型、进行G研究、进行D研究;概述该框架的三个特点:对概化理论的基本概念和分析要素进行有效区分,对单变量概化分析和多元概化分析进行有机整合,对概化理论分析思路进行一定程度的创新性总结。  相似文献   

4.
为明确多元概化理论对于儿科学临床技能考核的评价作用,该研究采用mG ENOVA2.1概化理论分析软件,对52名临床医学专业本科生的儿科学临床技能考核结果进行分析。结果显示,此次考核有较高的信度,考核内容设计最合理。多元概化理论能客观、科学地评价儿科学临床实践技能考核,值得进一步在临床教学中推广应用。  相似文献   

5.
运用概化理论对优秀博士学位论文评选的信度进行研究,分析了各种误差源及误差的大小。结果表明,评选的信度从总体上是较高的。在资源有限的情况下合理的论文评价人数为5~7人。  相似文献   

6.
使用概化理论作为分析框架,请20位评分者对11位大学生每人2次翻译测试进行整体评分,通过一系列的概化(G)和决策(D)研究,以检验不同背景评分者的翻译测试的有效性和可靠性问题。实验研究的结果表明,与有培训背景的评分者相比,没有培训背景的评估者对评分标准把握不一致,对翻译评分存在较大差异。同时还发现,当前翻译测试主要靠评分者的经验来兑现将无法产生可接受可靠性系数,对评分者进行系统培训可以提高翻译测试信度。  相似文献   

7.
概化理论在结构化面试评分误差中的应用研究   总被引:1,自引:0,他引:1  
应用概化理论对结构化面试的评分误差的控制问题进行了研究。结果表明:结构化面试评分能够较好地反映出被试的真实能力水平,评分具有较高的信度;在保证较高的面试评分信度(0.80)的情况下,建议将考官人数减少至9名,以提高结构化面试的经济性和效率性。  相似文献   

8.
概化理论作为新一代测量理论逐渐应用于大规模考试领域。文章运用多元概化理论对自学考试课程《英语水平考试(一)笔试》试卷的测量信度、试卷总分合成、及格线决策信度、试卷结构优化等问题进行探讨。研究发现:本次考试的测量信度较高;各分测验对全域总分的方差贡献比例与试卷赋分意图基本一致;该试卷以60分作为及格线具有较高的决策信度;将各分测验题量同时增至15题或单独将词汇分测验题量增至20题,可有效提高测量信度。  相似文献   

9.
小组讨论形式的口语考试既可以提高考试的效率,又能考到总结谈话等面试考试所考不到的谈话管理能力,所以被认为是可以应用在一般教学环境中的有效的口语考试方式。文章利用概化理论对小组讨论形式口语考试的总体信度进行了实证考察,考察结果表明小组讨论形式口语考试有可能被接受的信度。同时,为了最大限度地节省考试的时间和人力等资源,文章研究通过概化理论的D研究在保证考试信度的基础上科学地削减了分项评价项目的个数。  相似文献   

10.
概化理论(Generalizability Theory)是当今最重要的三大测验理论之一,与经典测验理论(Classical Test Theory,CTT)和项目反应理论(Item Response Theow,IRT)相比,不仅信度观为人乐道。而且效度观也令人耳目一新。为了更好地把握测量效度,本文将从二个方面讨论一下概化理论的效度观。  相似文献   

11.
白娟 《考试研究》2013,(1):51-57
全国硕士研究生入学中医综合考试,是为高等院校和科研院所招收中医药学专业硕士研究生而设置的、具有选拔性质的全国统一入学考试科目。本研究运用多元概化理论评估2012年中医综合考试的总体信度、试卷结构及二级学科分配比例的合理性。结果表明:(1)从考查的学科内容看,方剂学、中药学、针灸学、中医内科、中医诊断学的测量精度较高,而中医基础理论的测量精度相对偏低,可通过适当提高该学科试题的难度和区分度以增加测量精度;(2)从设置的题型看,各题型的测量精度均较高,各题型的分量分布较适当。  相似文献   

12.
高等教育自学考试(以下简称"自学考试")是汲取科举考试精华、融入现代教育理念的具有中国特色的现代教育形式。但长期以来,自学考试机构存在着重视考试、忽视学习过程的倾向。就自学考试的管理体制而言,基本是一种考试管理体制,自学考试的教育功能存在着局限性。社会助学是自学考试的重要组成部分,是自学考试作为一种教育形式存在的基础。就如何正确认识自学考试的社会助学工作,笔者力图找出问题的症结,提出改进助学工作、完善自学考试教育功能的一揽子设想和措施。  相似文献   

13.
测验长度(test length)是影响语言测试信度和效度的重要因素之一。本文借助概化理论(Generalizability Theory,GT)的固定侧面s×(i:p)嵌套设计和边际效用递减法则(the Law of Diminishing Marginal Utility),对中国汉语水平考试(HSK[中级])的测验长度进行了实证研究。研究结果显示:由130题构成的HSK[中级]测验具有相当高的测验信度,概化系数(Eρ2)可达0.8890,即使将测验的题目数量减少至120题或110题,测验的概化系数仍可以达到0.8856和0.8816(分别降低了0.38%和0.83%),这种测验长度的缩减不仅明显地降低了研发成本,而且提高了测试效率,完全能够满足标准化考试在误差控制方面的较高要求,并确保测验结果和分数解释具有较高的信度和效度。  相似文献   

14.
用概化理论分析高校教师教学水平评估   总被引:4,自引:1,他引:3  
用现代测量理论--概化理论对高校教师教学水平进行评估,提出改进性建议.使用自编的教师教学水平评估问卷,要求543名学生对大学外语部16名教师进行评价,对收集的数据作嵌套设计的多元概化分析.评估的可靠性较高,但某些指标可靠性不高;评估问卷原定指标权重不是最佳权重,通过改变权重可以提高评估的可靠性.  相似文献   

15.
信度是衡量测量结果稳定性与可靠性的重要指标,反映了测量过程中对误差控制能力的大小。信度分析是自学考试试题评价的重要内容,包括测量分数信度分析与及格线决策信度分析。本文简要介绍了CTT信度观、GT信度观及IRT信度观的理论内容与信度分析方法,并对三种测量信度观进行比较。本文提出,自学考试的信度分析工作应结合具体课程的考试特点、试卷结构、考试作答数据类型等因素,同时考虑CTT、GT、IRT三种信度观的优势及信度估计方法的应用条件,根据具体研究目的选择最恰当的或综合运用不同的信度分析方法。  相似文献   

16.
在参考全国考办2000年问卷调查的基础上,结合近10年的变化以及福建省自考工作的现状,笔者在福建省范围内对现有在籍考生开展大型问卷调查,通过问卷了解目前自考考生的群体特征和学习需求以及他们对自考未来发展的看法等。在此基础上提出对自考工作的几点建议。  相似文献   

17.
自学考试网络助学学习支持服务体系   总被引:2,自引:0,他引:2  
自学考试网络助学的学习支持服务体系在充分利用技术手段的同时,必须适应自学考试制度本身的特殊性,以促进整个自学考试助学事业健康顺利发展。自学考试网络助学的学习支持服务体系在其实施主体、服务内容等方面都有其自身的特色,建立自学考试网络助学的学习支持服务体系对完善自学考试制度有着不可替代的作用。  相似文献   

18.
高考是我国现阶段最有影响的高厉害大规模教育考试。因此,研究高考质量具有重大的意义。在过去十年中,我国学者对高考的信度和效度的研究多局限于运用古典考试理论。本文提出了运用项目反应理论进一步研究我国高考的信、效度的建议,并探讨了运用等值、链接等当代教育测量学技术,建立跨地区、跨年分的高考大型数据库的可能。这些方面的研究可以为高考改革及相关教育决策提供更多可靠信息。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号