首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
潘浩 《考试研究》2014,(2):59-63
早期的单维IRT模型忽视了测验多维性的可能,而多维IRT模型对各维度的划分不够明确,不能很好地反映各维度能力的内涵。高阶IRT模型承认测验的多维性,以分测验划分维度,同时又将多个维度的能力统一到一个高阶的能力中,能够在了解被试各维度的能力同时,为被试提供整体的能力估计,它能更好地反映实际,并且适应大规模测验的需求。  相似文献   

2.
本研究采用“共同题?锚测验”设计,使用R语言ltm程序包中的IRT两参数模型进行各年级小学生数学学力认知诊断测验和被试参数的估计,并使用equateIRT程序包进行跨年级小学生数学学力认知诊断测验各项参数的等值转换。结果表明,等值转换后各年级测验的题目难度和小学生数学学力均随年级增长而逐渐递增,不同学校、民族、性别学生的数学学力发展差异性特征均与理论假设相符。本研究验证了采用IRT垂直等值方法构建跨年级小学生数学学力发展水平垂直量表的可行性,为制定系统性补救教学方案和自适应题库建设提供了必要的实证证据。  相似文献   

3.
相关研究表明,IRT在教育考试评价中比CTT具有诸多优点。本文以某地区高考数学考试数据为基础,比较CTT与IRT在项目参数、评价方式、精度估计三个方面之间的差异。研究结果证明,在IRT下参数更容易反映观测各个项目的特征属性,IRT参数比CTT参数更具精确性,项目信息函数能更好的反映试题信息;CTT与IRT的评价方式不同,IRT下的能力分数优于CTT下的测验分数,更能反映学生能力水平;CTT与IRT精度估计不同,IRT测验信息函数和能力置信区间比CTT有更好的精度。实证展示出IRT在高考数学考试评价中的优越性,具有重要的价值和应用前景。  相似文献   

4.
随着教育评价理论的发展和信息科技的进步,题库建设愈发强调试题存储、管理和调用的动态过程。在这一动态过程中,按照什么标准和程序检验、添加新试题是题库维护工作的重要议题。以某学科学业能力测评的题库维护为例,使用基于Rasch模型的链接测评技术和题库维护方案,选择链接设计后重组题库,通过分析新、旧题库的试题所考查的能力维度、难度指标、功能差异等评估链接质量,将检验合格的18道试题存入题库。基于Rasch模型的题库维护方案提供了一套较为系统的工作程序和检验指标。  相似文献   

5.
《现代教育技术》2019,(10):41-47
题库是考试实践中不可或缺的要素,如何构建具有良好试题内容和试题参数的题库一直是教育评价领域关注的焦点。文章以师范生的"现代教育技术"公共课为例,通过探讨基于项目反应理论的题库构建,论述了试题编制的原则、试题的等值设计、试题参数的估计方法以及如何利用信息函数进行题库质量的评价。最后,文章指出了题库构建中尚存的不足和未来研究方向。  相似文献   

6.
物理题库计算机管理系统,以现代教育理论中的经典测量理论为依据,以计算机科学技术为手段,能够对物理教学中大量使用的各类测验试题进行研究编审、分类存储和有效管理,能按照试卷生成理论和工作方案的要求自动组成试卷供教学评估和考试使用。这其中,自动组卷系统是物理题库计算机管理系统的一个主要组成部分,它能够根据输入的考试内容、试卷难度系数、考试时间以及同类试卷份数等不同的要求,在题库中快速自动的生成所需的试卷。自动组卷的核心包括两个部分:一是根据输入或缺省的试卷指标自动生成每道试题的试题指标;二是在题库中搜索查找与试题指标相匹配的试题,组成测验试卷。  相似文献   

7.
题库内部结构是指导题库命题设计的重要理论依据,试题的参数指标系统和试题在各个指标上的分布状况是题库内部结构设计的主要内容。本文结合高考化学学科知识体系和命题方式所具有的特性,对化学试题参数指标系统和化学试题在各个指标上分布状况进行精心设计,确保化学题库的内部结构能够准确反映化学试题的内容和结构特征,能够合理规划试题布局。  相似文献   

8.
回顾国内外有关小样本情况下估计试题的Logistic IRT参数的研究,可以总结出六种参数估计方法,分别是:修改IRT模型法、提供先验信息法、人工神经网络法、非参数估计法、经典测验理论标准化法以及使用数据增强技术。后续研究应加强对已有参数估计方法的改进,使用包括标准误在内的多种误差指标,在250人以内的样本水平上,采用模拟数据与真实数据相结合的模拟实验法开展更加严谨的模拟研究。  相似文献   

9.
计算机化自适应测验(CAT)模拟是CAT研究的主要方法之一。CAT模拟结果的评价分析内容主要包括三个方面:被试能力估计与被试能力分类分析、题库试题使用情况分析和CAT测验作答过程分析。CAT模拟结果的分析模式主要分为整体分析和细化分析两种模式。本研究从测验模拟返真性能、测验准确性、题库安全性、题库使用率、测验分类效率与准确性、多测验目标约束控制的实现程度等角度概述CAT模拟结果的各类评价指标。CAT模拟结果的评价角度和评价指标需要根据CAT研究目标和测验情境要求加以确定。  相似文献   

10.
项目反应理论下的测验信度能够评价潜在特质估计的可靠性与稳定性,由于具有宏观性的特点,项目反应理论信度的作用并不能被测验信息函数所取代,是IRT测验的一个重要指标。本文参考国内外文献,首先介绍国内外学者关于IRT信度作用的观点,并介绍和评价了多种IRT信度估计方法,然后简要介绍IRT信度的影响因素,最后展望了IRT信度领域后续研究尚可着力之处。  相似文献   

11.
用项目反应理论编制标准化考试题库系统,旨在探究教育测量的新理论应用,为学科教育评价提供辅助工具。题库以四年级数学为测验内容,按标准化编制项目施测、评分、分析,其中选用三参数的逻辑斯蒂克模型,并用贝佳法检验了测验的单纬性,利用ANOTE软件估计项目参数,用基于题目分类下的经验判断法建立一个划界分数,接合项目信息量组成题库,最后讨论了能力估计方法、抽题策略、结束控制等题库编制的关键技术。  相似文献   

12.
基于项目反应理论,以高中化学平衡测验的编制为例,探索了化学测验的编制方法。首先,基于高中化学课程标准、考试大纲、高考试题等文本材料,构建了化学平衡内容的属性模型;其次,编制了3份化学平衡的预测卷,利用项目反应理论软件——BILOG-MG3.0,估算每个项目的难度、区分度、信息量等参数和被试的能力值(θ);最后,基于信息函数的测验编制法,组建了一份效度较好、信度较高的测验卷。  相似文献   

13.
课程题库是开放大学建设和课程教学改革的重要实践载体,是通过网络技术和现代远程教育技术实现的、按照一定的模型与结构建立的、某门课程的习题或试题集合的数据库平台,具有适应性、系统性和层次性三大特点。课程题库开发是一个不断循环推进的过程,各类人员分别承担相应的职责。认知类习题是开放大学课程题库最主要的习题类型,以教育目标分类学为指导,可以从知识维度和认知过程维度开发认知类习题。另外,题库建设过程中应该注意统一思想,全面定位题库功能,重视技术支持。  相似文献   

14.
加强标准化题库建设是检测教学效果的必然要求,也是大学物理课程建设和教学改革的需要。运用项目反应理论开发题库,可以弥补基于经典测试理论的题库的不足,提高测量精度,缩短测验长度,使试题系数更加规范,保证试题的科学性和有效性。  相似文献   

15.
1前言 测验等值是对考核同一心理品质的多个测验形式系统地做出测验分数转换.从而使不同测验形式的测验分数之间具有可比性。由于项目反应理论(IRT)将项目难度与心理特质(能力)定义在同一量表上,故也可以认为IRT中的等值是将考核同一心理品质的多个测验形式系统地做出项目参数转换.从而使不同测验形式中的项目参数之间具有可比性。  相似文献   

16.
题库是现代计算机技术的产物,是计算机化测验的基础。无论是计算机智能化组卷测验,还是计算机自适应测验,都离不开题库。题库对心理与教育测验进一步科学化、现代化起到了较大的推动作用。在项目反应理论指导下的题库建设一般可分为题库总体设计、命题与参数设计、设计题库的生成系统、设计评分和解释等。  相似文献   

17.
等值模型的选择是题库建设的重要环节。本研究在IRT理论框架下,选择最为常用的Logistic模型,针对医学考试某一学科测试比较三种Logistic模型下固定共同题等值方法的差异。结果表明,单参数模型对共同题的参数固定更稳定,等值的精确性优于双参数模型和三参数模型,更适合用于该学科测试。  相似文献   

18.
一、引言题库(ITEMBANK)是“按照一定的教育测量理论,在计算机系统中实现的某个学科题目的集合”,它是严格遵循教育测量理论,在精确的数学模型基础上建立起来的教育测量工具。题库不仅仅是只有试题管理和组卷的功能,它更重要的功能是收集测试数据,并对这些测试数据进行统计与分析,发现题库中所存在的问题,发现教师教学过程中的问题,发现学生学习过程中的问题,以提供给教师更多的教学过程信息。建立题库是一个复杂的系统工程,首先要建立系统的教学模型,然后确定试题的属性指标以及试题的组成结构,再组织大批量的优秀学科教师编写试题。我…  相似文献   

19.
根据教育测量学的题库建设理论,通过组织测验样本,对题库题目进行预先测试,运用题目统计分析技术的有关算法,可以获得测验题目的难度值、区分度等相关技术参数.运用计算机的UML统一建模技术,构建题库题目难度的智能修正模型,可以实现题库中大量题目难度值的智能化运算和修正工作,从而进一步保证计算机题库建设的科学性.  相似文献   

20.
对不同类型学校的774名有效被试实施数学学业成就水平测试,并应用IRT参数模型方法进行分析,得出四点判断:(1)测验分数、最优分数呈负偏态分布;(2)测验信息函数负向偏移,大体呈现双峰波形;(3)主观性试题与逻辑斯蒂模型的拟合性较差;(4)不同类型学校学生的数学学业成就水平存在显著性差异。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号