首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
测验等值使得不同形式的考试能进行比较,从而保证了测验之间的相对稳定性。基于IRT的分数等值是在估计出参数的基础上进行的参数转换,等值结果的稳定性与考生样本量密不可分。本研究针对汉语水平考试(HSK)阅读分测验,采用真实数据模拟共同组锚测验设计,确定等值的参照标准,考察考生样本量的变化对IRT分数等值稳定性的影响。结果表明,考生样本量为2000左右时各种方案的等值结果均比较稳定。考生样本量进一步增大时,等值误差不降反增。  相似文献   

2.
本研究基于IRT理论中最常用的LOGISTIC三种模型来探讨等值的跨样本一致性,研究对象为某一汉语类别的测验,等值方法采用同时校准法。研究结果表明,双参数模型下同时校准法等值跨样本一致性最好,最为稳定。  相似文献   

3.
1前言 测验等值是对考核同一心理品质的多个测验形式系统地做出测验分数转换.从而使不同测验形式的测验分数之间具有可比性。由于项目反应理论(IRT)将项目难度与心理特质(能力)定义在同一量表上,故也可以认为IRT中的等值是将考核同一心理品质的多个测验形式系统地做出项目参数转换.从而使不同测验形式中的项目参数之间具有可比性。  相似文献   

4.
本文采用共同题非等组设计,对五种基于IRT的项目参数等值方法进行比较研究。研究数据来自湖北某试点地区课改实验区和非课改区考生在标准化中考数学科目的考试数据,兼用大样本标准和其他标准作为各等值方法比较的检验标准,以RMSD指标作为操作性检验标准,利用STUIRT程序进行等值分析。研究结果表明,针对本研究所设置的等值情境,MS方法稳健性最差,对于项目难度参数的等值,同时校准方法最好,其次是SL特征曲线法,对于项目区分度参数的等值,MM方法精确性最好。  相似文献   

5.
测验等值无疑是测量中一个重要问题。《面向心理学家的项目反应理论》一书指出,“项目反应理论(IRT)最初吸引美国测验编制人员。是因为这种理论可以解决许多测验中的实际问题,比如将不同形式的测验形式等值。”《BILOG.3使用说明书》指出,“IRT与经典测验理论(CTT)相比,或许最大的长处是测验等值”。事实上,在IRT框架下实施等值,不仅理论完善,前提条件较容易满足,而且等值关系式也十分简洁。  相似文献   

6.
促进中小学生数学学力发展是数学教育的重要任务。本文选用了日本"全国学力调查"小学六年级数学试卷,对中国五省部分六年级学生的数学基本知识的掌握情况和灵活应用的能力进行测试,并与日本同龄小学生进行比较,分析两国小学生数学学力的异同,对我国数学课程与教学改革进行一些思考。  相似文献   

7.
一 研究宗旨 本课题为国家社会科学基金项目《新疆维吾尔族、哈萨克族心理调查》的子课题,拟将少数民族的认知特点和智力发展水平作为整体研究项目的一个突破口。 我们课题组选用了中央教科所赵裕春研究员主编的《小学生数学能力测验》作为团体测验内容。这套测验是标准化的,信度好、效度高。该测验共有六套测验材料,每年级一套。测验有  相似文献   

8.
中考是各地区规模较大和有影响力的高利害性考试,只有建立科学完善的考试评价系统才能充分发挥中考对地区初中教学多方面的服务作用,而建立完善考试评价系统的必备程序是等值。IRT等值的步骤包括估计项目参数、进行IRT量表转换以及制作分数转换表。  相似文献   

9.
本研究旨在基于事先构建的理论模型,编制小学数学应用题认知诊断测验,并通过认知诊断评估对其效度进行验证。采用质性研究和量化研究两条思路,通过认知分析、大声思维和测验等方法,探索了认知诊断评估从理论模型构建到测验编制及其效度验证的过程。在理论模型构建和测验编制方面,所得结果表明认知分析和大声思维相结合能够合理地构建实质心理学的认知模型,并且基于该认知模型自上而下的测验设计是与认知诊断评估流程相吻合的。通过认知诊断评估所获取的数据分析表明,该测验的结构效度、内部效度和外部效度均达到理想水平,基于事先构建的认知模型所编制的认知诊断测验能够作为认知诊断评估的有效工具,有助于发掘和诊断学生数学应用题解决中的认知错误。  相似文献   

10.
本研究采用锚测验非等组设计,探究了锚测验样本量的变化对等值结果的影响。数据来自全国英语等级考试(PETS),使用以Bigsteps为核心的自主改进软件,基于Rasch模型估计题目参数。为了探究等值结果对合格分数线的影响,本研究对比了不同样本量锚测验参数估计值与锚题参数给定值的差异,并对不同样本量锚测验得出的实考试卷等值结果与最大样本量锚测验得出的实考试卷等值结果进行了差异分析。结果表明,当锚测验样本量达到150时,等值结果比较稳定。这一结果表明,PETS设定的300人左右的锚测验样本量是合理的。  相似文献   

11.
在测验考试中,人们显然有种种理由要求比较、解释不同地区、单位、时间的同一学科的考试分数;在考试命题中,也有理由希望对同一学科不同形式的试卷、试题参数作比较,从而确保测验考试的公平和正确评价试题建立题库等等.这些,都涉及到“等值 问题.所以,测验等值是考试研究中均一个非常重要的问题.一、测验等值的概念、作用、形式测验等值,是指对测量同一心理特质的不同测验分数或试题参数,通过一定的数学模型,转换成同一单位系统中的量数,以利于相互比较的方法.测验等值的转换,是独立于导出这种转换式时所使用的具体考生组的.好象天气预报时气温摄氏度数与华氏度数的互化有公式F=1.8c+32一样,不依赖于当初求得这一公式时是从气体还是从液体物质中取得的.这是测验等值的一个重要特点,也是一项根本的要求.并非任何测验都是可以等值的,首先,进行等值的测验必须是测量同一心理特质的测验.比如比较考生不同次测验的成绩,只能是对同一学科的成绩相互比较.所以.不能通过值转换,把语文分数转化为数学分数,把初等数学分数转化为高等数学分数.因为这些都  相似文献   

12.
青海省中学生心理健康现状调查分析   总被引:1,自引:0,他引:1  
本研究采用《心理健康诊断测验》(MHT—CR)量表对青海省1580名中学生进行测查,结果说明青海省中学生心理健康总体水平良好;女生心理健康总体水平低予男生;从各年级的心理健康状况的比较中可以看出:高一年级与其它年级相比心理问题较多。  相似文献   

13.
本研究采用d2测验,对三至六年级的400名小学生进行了测试,试图验证d2测验的信度和效度,并发现小学生选择性注意的发展特点及其与学习成绩的关系。  相似文献   

14.
我国小学生数学能力协作组的研究表明:四年级和六年级小学生学习数学的兴趣、态度和抱负水平与他们在相应的数学能力测验上取得的成绩有非常显著的关系。随着年级的升高,这三种非智力因素与小学生数学能力发展的关系更加密切,作用也有所增大,其中学习数学兴趣的作用,从四年级时的居第3位跃居到六年级时的第1位。  相似文献   

15.
为深入了解农村小学生数学学习焦虑的现状,本文采用修订的《小学生数学学习焦虑量表》对甘肃省平凉地区四所农村小学的454名小学生进行了调查。结果显示:农村小学生数学学习焦虑整体适中;四五六年级的小学生在数学学习焦虑上呈现出"Λ"字形发展趋势,五年级是小学生数学焦虑上升的一个转折点和关键点;各年级女生数学焦虑显著高于男生。学校和教师应高度关注小学生数学焦虑的年级发展趋势和性别差异,提高学生尤其是女生的课堂参与性,降低学生数学焦虑。  相似文献   

16.
我国小学生数学能力协作组的研究表明:四年级和六年级小学生学习数学的兴趣、态度和抱负水平与他们在相应的数学能力测验上取得的成绩有非常显著的关系。随着年级的升高,这三种非智力因素与小学生数学能力发展的关系更加密切,作用也有所增大,其中学习数学兴趣的作用,从四年级时的居第3位跃居到六年级时的第1位。  相似文献   

17.
基于项目反应理论,文章介绍了测验等值问题的意义和模型,然后分析了测验等值的原理,并采用最小二乘估计法对其中涉及到的转换系数进行了参数估计,真正实现了项目反应理论中的项目参数等值和真分数等值.  相似文献   

18.
基于认知诊断评估理论和技术,本研究采用文献分析、专家研讨和口语报告法构建5~6岁儿童"数与运算"领域数学问题解决的认知模型,对627名5~6岁儿童进行认知诊断评估,运用认知诊断模型—数据拟合对认知模型和诊断测验进行质量检验。结果显示,认知属性对题目难度的解释量为0.879,效应量为0.834,平均HCI为0.749;认知诊断测验题目的平均区分度为0.707(标准差为0.299);除两题的题目拟合度S-X^2指标的显著性水平<0.01,其他题目的拟合度都较好;测验的信度为0.95;平均掌握概率与测验总分呈单调递增曲线。以上结果说明,本研究构建的儿童数学问题解决认知模型良好,编制的认知诊断测验具有较理想的测量信度与效度,可以作为评估儿童数学问题解决的有效工具,并可以提供精细丰富的诊断信息,从而为相关教育教学及干预研究提供科学依据。  相似文献   

19.
测验等值不是无条件的分数转换,需要满足公平性、横跨群体的不变性、对称性和测验的一维性等条件。测验等值可以解决诸如不同学年度学生成绩比较、不同学校不同地区学生成绩比较、不同班级教师教学水平比较等问题。进行测验等值需做好等值设计,锚测验设计是等值设计中常用的一种,不同的锚测验设计有不同的要求。结合某实例,本研究介绍了测验等值在实际中的应用。  相似文献   

20.
民族地区国家通用语言测验题库的创建是一个系统工程。在构建题库的过程中,首先要制定题库的描述性参数体系,并以能力维度和文本维度标注所有试题。之后是确定最优的IRT统计参数估计模型和等值参数转换方法为Logistic双参数模型和同时校准法,使得试题的IRT统计参数能够统一到一个量表上。最终构建的题库由50多套试卷的试题及其描述性参数和统计参数构成,涵盖测验所需测查的各种能力和文本,各项参数指标良好,能够保证测试的有效性和高信度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号