首页 | 本学科首页   官方微博 | 高级检索  
 共查询到17条相似文献,搜索用时 171 毫秒
高等教育自学考试试卷平行性及其评价维度初探   总被引:1,自引:1,他引:0  
高等教育自学考试是一种典型的标准参照测验。试卷的平行性可以界定为相同专业下同一课程的不同试卷在形式、内容、功能和分数结果上的一致性和可比性,它对自学考试的科学性和有效性具有非常重要的意义。对自学考试试卷平行性的度量和控制,可以从试卷结构、题目内容、题目功能和结果数据四个方面进行。  相似文献   

复本试卷的平行,是确保自学考试标准稳定的重要手段。影响试卷平行的因素包括试卷结构、知识内容、难度分布、认知层次的构成等,它们从不同维度上共同构成了平行试卷的指标控制体系。在命题和题库建设中,通常使用命题细目表和知识内容赋分比例表作为控制试卷平行的手段。  相似文献   

从经典测量理论和中考实践两个视角研究中考物理试题区分度与难度的关系,发现单凭控制试题难度难以实现对区分度的控制。通过题目得分率与物理总分关系的研究,探讨难度和区分度相同或相近题目局部区分功能的差异,探究中考试题难度和局部区分功能的设计方法及应用。  相似文献   

难度常模的构建不仅带来了命题理念的转变和命题过程中控制技术的突破与改进,也大大简化了考试分数分布的模拟与预测过程。借助难度常模模拟和预测考试分数分布有两种方法:逐题比较法和分类合并法,分别适用于题目数较少与题目数较多的试卷。前者通过题目指标预估表和命题蓝图二者的比对,同时在难度常模中比对配对题目的数据预测分数分布;后者先将题目按难度和区分功能类型进行合并,再查询难度常模估取相应题目数据,计算得到各目标群体的得分情况。  相似文献   

考试分数可比性关乎考试公平,是检验一门考试质量的重要维度,尤其对于存在多个平行试卷的大规模英语测试更是如此.考试分数可比性研究中最关键的一步是考试分数等值.本文借助项目反应理论,展示了如何按照IRT的等值程序对高考英语两份平行试卷分数进行等值.通过建立的对应等值分数,结果呈现:(1)这两份试卷难度不同,使用实际考试分数时必须参考等值结果进行相应处理;(2)使用项目反应理论对高考英语考试分数进行等值时必须进行严格的模式筛选过程选择适合数据的参数模型.  相似文献   

简答题和论述题是政治高考长期使用的题型,这类题目在高考试卷中所占分值较大,但是考生的得分率普遍较低。考察考生失分比较多的原因,主要是在审题和解题方法这两个环节上。笔者在此文中就考生如何在政治主观题的解答中抢到应得的分数提出了自己的建议。  相似文献   

中考英语听力试题特点与变迁   总被引:1,自引:1,他引:0  
中考英语听力试题在试卷结构、题量、题材、语速、语言风格、题目呈现形式、测试要点分布等方面均有一定特点和规律。一般而言,听力试卷结构稳定,语言口语化,测试内容呈现顺序性,话题交际功能突出,其测试点有鲜明特征:数字与计算、地点与场合、推理与判断、主旨与大意等。试题从题型到内容,从题量到分值不断调整,稳中有变,但试卷整体结构稳定。  相似文献   

中考英语听力试题在试卷结构、题量、题材、语速、语言风格、题目呈现形式、测试要点分布等方面均有一定特点和规律.一般而言,听力试卷结构稳定,语言口语化,测试内容呈现顺序性,话题交际功能突出,其测试点有鲜明特征:数字与计算、地点与场合、推理与判断、主旨与大意等.试题从题型到内容,从题量到分值不断调整,稳中有变,但试卷整体结构稳定.  相似文献   

就2010年高考数学(全国卷I)整体而言,延续了往年的命题风格,题型结构、分值、题目设置情况等均没有太大变化:整个试卷注重学科基础知识的综合性和灵活性,不刻意追求知识覆盖面,传统主干内容依然受到重视,体现了对数学“双基”的新诠释:注重对常规思想方法、理性思维的考查,在平稳中有创新,虽然个别题目过难,难度略有提高,可能对于中下学生的区分造成影响,但总体上是一份较好的试卷,有利于人才选拔,也有利于课改的推进。  相似文献   

中考数学的压轴题在中考试卷中有较大的占比,分数也比较多,但由于压轴题目知识内容广,难度较大,灵活度较高,思路复杂,综合性比一般的题目强,所以部分学生难以解开压轴题,但中考数学试卷中压轴题一直都是师生关注的焦点问题。  相似文献   

本文通过对2011年新汉语水平考试HSK(六级)8次考试的试题进行项目功能差异(DIF)分析,以评估其性别公平性。结果显示,800个试题中存在DIF的题目占总数的3.3%;800个试题的MH值平均数为0.02,其95%置信区间包含0,即试卷总体上不存在DIF。因此,HSK(六级)具有较理想的性别公平性。  相似文献   

The purpose of this article is to present an analytical derivation for the mathematical form of an average between-test overlap index as a function of the item exposure index, for fixed-length computerized adaptive tests (CATs). This algebraic relationship is used to investigate the simultaneous control of item exposure at both the item and test levels. The results indicate that, in fixed-length CATs, control of the average between-test overlap is achieved via the mean and variance of the item exposure rates of the items that constitute the CAT item pool. The mean of the item exposure rates is easily manipulated. Control over the variance of the item exposure rates can be achieved via the maximum item exposure rate (rmax). Therefore, item exposure control methods which implement a specification of rmax (e.g., Sympson & Hetter, 1985) provide the most direct control at both the item and test levels.  相似文献   

考试是检验教与学效果的重要手段,试题库是试卷的基础,试卷分析法是检验试卷合理性与详细分析考试结果的方法。建立试题库及从中抽取试题时应遵循不重复、不遗漏、均衡分配得分、题型多样等原则;抽取试题方式要注意题型控制、章节控制;试卷分析法的三种图表对了解学生和改进教学有很大的帮助。  相似文献   

为保证语言测试题目的质量和加强题库建设,本文基于经典测试理论,使用Gitest Ⅲ对一份高考试卷(阅读部分)题目进行项目分析,结果显示:该阅读题目的难度、区分度较理想,但难度分布并不理想。建议在使用题库中的组合试卷前先进行试测,以改进试题的难度分布以及部分题目选项的质量,从而提高试题的信度和效度。  相似文献   

In this article, it is shown how item text can be represented by (a) 113 features quantifying the text's linguistic characteristics, (b) 16 measures of the extent to which an information‐retrieval‐based automatic question‐answering system finds an item challenging, and (c) through dense word representations (word embeddings). Using a random forests algorithm, these data then are used to train a prediction model for item response times and predicted response times then are used to assemble test forms. Using empirical data from the United States Medical Licensing Examination, we show that timing demands are more consistent across these specially assembled forms than across forms comprising randomly‐selected items. Because an exam's timing conditions affect examinee performance, this result has implications for exam fairness whenever examinees are compared with each other or against a common standard.  相似文献   

无纸化考试是指利用计算机完成试题库的建立和管理、选题组卷、上机考试和阅卷评分等各个考试环节的活动,可有效地解决传统考试模式中存在的效率低下、试题质量难以控制以及试卷的保存和运输成本过高等问题,是今后考试模式的发展方向,无纸化考试是远程教育的一部分,是远程教学中不可缺少的环节,通过考试,教师可以对学生的学习效果进行考核,并借此了解学生的学习效果,为改进教学方式提供依据,据此提出无纸化考试在现行远程教学中的可行性和其无可比拟的优越性.  相似文献   

An important assumption of item response theory is item parameter invariance. Sometimes, however, item parameters are not invariant across different test administrations due to factors other than sampling error; this phenomenon is termed item parameter drift. Several methods have been developed to detect drifted items. However, most of the existing methods were designed to detect drifts in individual items, which may not be adequate for test characteristic curve–based linking or equating. One example is the item response theory–based true score equating, whose goal is to generate a conversion table to relate number‐correct scores on two forms based on their test characteristic curves. This article introduces a stepwise test characteristic curve method to detect item parameter drift iteratively based on test characteristic curves without needing to set any predetermined critical values. Comparisons are made between the proposed method and two existing methods under the three‐parameter logistic item response model through simulation and real data analysis. Results show that the proposed method produces a small difference in test characteristic curves between administrations, an accurate conversion table, and a good classification of drifted and nondrifted items and at the same time keeps a large amount of linking items.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号