排序方式: 共有13条查询结果,搜索用时 93 毫秒
1.
2.
关于汉语水平考试等值设计的新思考 总被引:2,自引:0,他引:2
ZHANG Jinjun JING Libo 《中国考试》2008,(8)
汉语水平考试(HSK)实施多年来,一直坚持等值。在实际等值过程中,HSK遇到了一些新情况,旧的等值设计暴露出一些局限,变得难以适应。本文有针对性地提出了预测等值和跨国等值等新设计,以期应对新问题。 相似文献
3.
Because parameter estimates from different calibration runs under the IRT model are linearly related, a linear equation can
convert IRT parameter estimates onto another scale metric without changing the probability of a correct response (Kolen &
Brennan, 1995, 2004). This study was designed to explore a new approach to finding a linear equation by fixing C-parameters
for anchor items in IRT equating. A rationale for fixing C-parameters for anchor items in IRT equating can be established
from the fact that the C-parameters are not affected by any linear transformation. This new approach can avoid the difficulty
in getting accurate C-parameters for anchor items embedded in the application of the IRT model. Based upon our findings in
this study, we would recommend using the new approach to fix C-parameters for anchor items in IRT equating.
This work was supported by a Korea Research Foundation Grant funded by the Korean Government (MOEHRD, Basic Research 相似文献
4.
5.
6.
基于项目反应理论中的LOGISTIC双参数模型研究共同题非等组设计下,考生能力分布与被试量对等值的影响。等值方法采用分别校准下的项目特征曲线法、Stocking-Lord法、Haebara法。等值结果采用等值分数标准误、等值系数标准误、共同题参数稳定性三种方法进行评价。研究结果表明,考生能力分布越接近,被试量越大,等值误差越小;且Stocking-Lord法较Haebara法的等值结果更稳定。 相似文献
7.
本文首先介绍了项目反应理论的优势、项目反应模型及一些等值的方法,然后详细用R方法对Samejima等级反应模型进行处理和模拟,以检测其误差及优劣性. 相似文献
8.
应用项目反应理论等值含有多种题型考试的一个实例 总被引:2,自引:2,他引:2
本文以美国一个州的高中统考为例介绍应用项目反应理论来对含有多种题型的考试进行等值处理的具体做法,同时也对考试的其他技术环节进行了一些探讨。 相似文献
9.
近年来关于DINA模型的相关研究显示,样本量、先验分布、经验贝叶斯或完全贝叶斯估计方法、样本的代表性、项目功能差异和Q阵误指等,均可能是导致DINA项目参数估计发生偏差的原因。使用Monte Carlo模拟试验,对DINA项目参数(猜测参数和失误参数)的组合变化类型和偏差量进行考察,通过条件极大似然估计法估计知识状态,发现项目参数估计值与真值偏差不大时,对知识状态估计的精度影响不大;但是项目参数偏离真值较大时,尤其是在三种组合类型上,对属性掌握存在明显的高估或低估现象。研究结果对于诊断测验等值有一定的启示:若两个测验上锚题的项目参数出现了较大的偏差(0.1),则需要考虑等值的必要性。 相似文献
10.
“测验连接”概念框架演变述评 总被引:1,自引:0,他引:1
测验连接是心理与教育测量研究中一个重要的领域,是通过统计方法将一个测验的分数以另一个测验的分数单位表示,或者将两个测验的分数表示在共同的分数量尺上。虽然测验连接有较长的研究历史,但是不同学者对其有不同分类。其中有些分类术语别无二致,但其定义却大相径庭,这使研究者和实践者产生了极大混乱。鉴于此,有必要从历史的角度梳理连接的概念框架及其变化,以便更好地理解和应用测验连接。 相似文献