首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 826 毫秒
1.
运用多策略的多级评分认知诊断方法对被试就"进位计数制"这一内容的掌握情况进行诊断,得到每个被试的属性掌握模式,提供了一种多策略的多级评分认知诊断的应用范例。  相似文献   

2.
一、批判与初衷现行的测验项目分析方法基本上是以经典测量理论为依据对项目的难度与区分度加以考查。而且,无论对二点式评分项目还是多级评分项目都只分析出一个难度值和一个区分度值退一步说,现行的项目分析方法的局限若是对二点式评分题目还不明显的话,那么在多级评分题目中却是显而易见的。因为多级评分题目中的各个作答步骤(或评分级别)都各有其特征,用一个指标来衡量它们势必掩盖或抹杀了许多有用信息,很大程度上丧失了多级评分题目所应提供的功效。由于IRT(项目反应理论)系统的严谨与手段的灵活,它比经典测量理论更好地表现了被试能力(潜在特质)与其在项目作答中的动态联系。IRT多级反应模型  相似文献   

3.
认知诊断通过分析被试的项目作答反应,推断被试的认知属性掌握状态,为学习困难学生设计补救教学提供了非常有价值的信息。本文作者在探讨了小学生多位数乘法计算能力的认知属性、编制了2份相同考核模式的认知诊断测验后,选择江西某小学310名高年级学生为被试,先施测第1份认知诊断测验,采用DINA模型,自编参数估计程序进行诊断,得到了每一个被试的属性掌握模式分类及全体被试在各个属性上的掌握情况。然后设计和实施补救教学,在实施补救教学后再施测第2份认知诊断测验以检验补救效果。研究发现:(1)该小学高年级学生对0XN运算法则、多位数乘以两位数的运算程序、乘法进位认知属性的掌握不太理想,特别是乘法进位。(2)属性掌握模式中属全部掌握模式的被试人数占86.47%,其余被试均分类于存在各种认知不足的掌握模式。(3)比较两份认知诊断测验报告,结果表明在认知诊断指导下的补救教学有针对性,补救后被试正确作答项目增多,属性掌握个数也有所增加,补救效果良好。  相似文献   

4.
规则空间模型是一种基于统计模式识别和分类的认知诊断理论,能够提供关于考生作答模式与属性掌握情况的详细信息。本研究运用该模型,在详细考察口腔内科学知识属性的基础上,对参加2006年口腔执业医师考试的454名考生进行诊断,最后得到八种典型反应模式,并将454名考生的实际作答模式判归为这八种典型反应模式,从而实现对考生口腔内科学知识属性掌握的识别及其分类,针对我国执业医师考试分数报告的形式和内容提出了改进建议。  相似文献   

5.
《现代教育技术》2019,(5):92-98
文章对计算机自适应测试中常用的参数估计法——联合极大似然估计(Joint Maximum Likelihood Estimation,JMLE)法进行了改进,提出了一种基于三值矩阵的联合参数估计方法——3V-JMLE法。基于此,文章以作答反应数据库中被试作答信息为样本,分别采用JMLE法、3V-JMLE法进行参数估计,其对比结果表明:在理想作答矩阵下,3V-JMLE法和JMLE法具有同等的参数估计精度和计算效率;在非理想作答矩阵下,采用JMLE法进行参数估计存在一定的局限性,而采用3V-JMLE法具有很高的参数估计精度并大大提高了计算效率。3V-JMLE法的提出,对于联合参数估计方法的实际估计参数过程有重要指导意义。  相似文献   

6.
针对目前高考语文阅读主观题评分方法的局限,提出基于SOLO理论的分类评价法和基于阅读认知过程的建构整合模型(CI)评分法。选择1019名学生高考语文阅读三道主观题的真实作答,采用三种评分法评分,采用项目反应理论对三道主观题进行测量学分析,结果表明:相对于原始评分法,SOLO评分法和CI评分法题目之间具有更高的相关,测验模型拟合更佳,题目区分度较高,题目得分的难度阈限和步长更合理,题目的信息量更大,而CI评分法又明显优于SOLO评分法。研究支持了将CI评方法作为高考语文阅读主观题评分方法的潜在优势。  相似文献   

7.
为识别计算机实验室内潜在的火情,并及时发出分级火灾预警信息,该文提出一种基于加权马氏距离判别的计算机实验室火灾风险预警方法,通过部署多种类型传感器采集并分析易引起火灾风险的多项指标数据,判断实验室内火灾风险等级,并针对不同火灾风险等级提出相应的预警处理措施。通过模拟实验证明,基于加权马氏距离判别的计算机实验室火灾风险预警方法具有较高的预警精度。  相似文献   

8.
项目反应理论(Item Response Theory,IRT)是现代教育心理测量领域中最有影响的一种测量理论,它的一个明确目标是扩展模型的种类以至于能够处理实际测试中任何形式的反应数据。在已有的各种模型研究中,对于多级评分项目,只考虑到项目区分度和难度。但在实际测验中,此类项目还可能存在猜测度。本研究基于Samejima等级反应模型,将项目猜测度融合到多级评分模型中,提出了三参数等级反应模型(Three-parameter Graded Response Model,3PL-GRM)。由于忽略多级反应项目的猜测度会使得该项目的信息量虚假升高,本研究还进一步将3PL—GRM的信息函数应用到试卷质量分析中。  相似文献   

9.
BP神经网络是目前应用最广泛的人工神经网络模型之一,在分类和识别上表现出良好的特性,因此被研究者用于认知诊断评估以对被试进行诊断分类。通过模拟研究,考查属性个数、属性层级关系、测验长度、题目质量、测试样本量5个因素对BP神经网络在认知诊断中分类准确性的影响。结果表明:1)基于BP神经网络的认知诊断分类准确率不依赖于测试样本量;2)题目质量和测验长度对BP神经网络的诊断准确率有显著的积极影响;3)属性个数对BP神经网络的分类准确率有消极影响;4)题目质量一定程度上会影响BP诊断方法在不同属性层级结构上的分类准确率。  相似文献   

10.
在数学分析教材中,判别正项级数敛散性常用两种基本方法.即DAlcmhert和Cauchy判别法,本文介绍这两种方法失效时,利用与广义调和级数比较、无穷级数与无限积分关系的方法推出的几种判别法。  相似文献   

11.
计算机化自适应测验是现代测验研究中的一个重要领域,而目前大多研究都基于0-1评分模型,适用范围不广。本文对Samejima等级反应模型进行探讨和研究,运用DELPHI开发研制多级评分计算机化自适应测验。  相似文献   

12.
认知诊断以微观认知角度对被试做出准确评估与反馈的优势在心理与教育测量领域展现出巨大发展潜力,但要利用这种优势就必须确保Q矩阵的合理性。研究表明错误界定的Q矩阵会严重影响模型参数估计和被试分类准确性。本文从参数化与否出发介绍6种基于被试作答反应的Q矩阵估计方法的基本思想、实现步骤及应用情况,总结这些方法的特点并展望未来研究方向,为认知诊断研究及应用提供借鉴和基础。  相似文献   

13.
文章梳理了国外学者对概念图评估的界定,指出了概念图评估的特点及其研究阶段。阐释了Ruiz-Primo & Shavelson基于概念图测评的构架:任务、作答及评分系统。给出了Novak的评分系统从普遍使用的四种评分方法:关系法、结构法、标准图法和命题得分法。最后介绍了学者们对学科教师运用概念图评估时的建议及有待研究的问题。  相似文献   

14.
对指数分布回归模型进行参数估计和统计诊断,首先给出参数的迭代算法,分析了数据删除模型,得到了诊断统计量广义CooK距离的一阶近似以及似然距离的一阶近似公式,最后进行实际问题应用的分析,发现两个统计量对强影响点有一定判别作用.  相似文献   

15.
评分,无论对理科题还是对文科题,无论对客观型题还是对主观型题,也无论是以一个符号作答的题还是必须写上数页的论文型题,人们均习惯于以一个十分简洁的分数或等级来标明其价值,这对于人们记忆与统计来说,显然是比较方便的。然而,随着目前教育观念的变革,人们不再把教育仅仅看作是一种鉴别与挑选人才的教育机构,不再把考试看作是筛选的工具。人们越来越重视评分结果的反馈、诊断与分析,普遍感到过于简单的分数或文字性的等级已无法满足教学与考试的实际需要.为此,本文就我们所试验的矩阵评分法作一介绍。  相似文献   

16.
针对多特征指标多传感器目标识别问题,提出了一种基于灰关联TOPSIS融合方法。利用置信距离作为新的属性评价值,通过求解各属性的置信距离的偏差平方和最大化的优化问题,求得属性的权重,利用灰关联度定义相对TOPSIS中的相对贴近度,进而给出目标识别方法。仿真实例验证了方法的有效性和实用性。  相似文献   

17.
本研究基于项目反应理论,探索题目变动的公开招聘考试的最优题型。利用《北京市新进人员通用能力考试》专业技术岗位1 000名考生成绩,通过探索性因素分析保证仅包含一个维度的情况下,使用项目反应理论等级反应模型分析10个题型的性能。先将各个题型不同题目的得分加和,将不同得分的频数转换为等级,分别计算区分度、难度、类别反应曲线和信息函数。最优题型用两种方法确定,一是选取信息量占比高于均值的题型,二是排除各种参数达不到常用标准的题型。两种方法得到非常接近的结果,即逻辑推理、图表解读、短文加工、阅读理解四个题型最优。  相似文献   

18.
一、问题的提出论文性试题的评分存在误差,这是由评分者的主观原因造成的。考察评分误差的方法常常是计算评分之间的相关度,从而估计评分误差对信度的影响,称为评分者信度。计算评分者信度一般有两种情况,一种是由两位评分者给许多被试评分,或一位教师给许多被试评两次分数,计算两次分数之间的相关系数;另一种是许多位评分者给许多被试评分,或一位教师反复多次给许多被试评分,计算肯德尔和谐系数。肯德尔和谐系数实际就是多列变量间的等级相关系数。  相似文献   

19.
文章主要介绍基于粗集方法的普通话等级判别专家系统的基本构成、知识表达方式及学习推理方法。提出了利用不可分辨性进行属性约简,导出决策规则的方法进行推理。实践证明,该专家系统具有可行性。  相似文献   

20.
随机选取某大学2007级本科生SCL-90异常组51人与正常组大学生93人实施罗夏墨迹技术(RIM)测试,发现两组学生在16个重要的RIM记分上有显著差异.判别分析发现以这16个RIM记分建立的判别方程能有效地对正常和异常被试进行属性判别.表明这些RIM记分能检测出与心理障碍有关的心理机制,同时也证明RIM是一种有效的心理诊断工具.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号