共查询到20条相似文献,搜索用时 250 毫秒
1.
如何科学地确定合格标准是基于标准的教育考试关注的重要问题.我国传统上是以60分作为合格标准的划界分数,而国外发达国家大多是在考后通过专门标准设置的过程,再确定合格标准的划界分数.我国大规模教育考试传统上以60分作为合格标准划界分数,主要是因为在命题阶段采取了命题质量控制方法,使得刚合格考生的得分在60分附近.本研究以某市高等数学统考课程考试为例,在考前以传统60分合格标准为目标,在命题阶段采取命题质量控制方法,使得刚合格考生的得分在60分附近,而考后通过Angoff标准设置方法专门确定合格标准的划界分数,对比这两种方法过程和决策结果,进行了深入分析和探讨.研究结论表明:考前命题阶段的合格分数调整方法与Angoff标准设置方法在本质上具有相通之处,但两者结果却相差较大,基于标准的教育考试在考后通过专门的标准设置方法来设定合格标准更为科学和全面. 相似文献
2.
3.
自学考试命题中及格线的校准方法 总被引:2,自引:0,他引:2
自学考试是标准参照性考试.是通过考察考生是否达到和掌握考试标准所规定的知识、技能和能力的要求来判定考生是否合格的.及格线的把握是否准确是自学考试命题质量的重要方面.控制及格线在自学考试中具有十分重要的理论和实践意义。在我国习惯于以60分作为及格线.因此控制及格线.就是尽可能使60分能够代表刚达标考生群体的水平.也就是说.刚达标考生群体作答试卷应获得60分的成绩。 相似文献
4.
5.
6.
听力理解(Listening Comperhension)是托福、全国英语水平考试(EPT)等大型语言测试不可或缺的重要组成部分,尤其对 EPT 而言显得格外重要,因为在 EPT 110分合格标准中包含有听力部分单独的合格标准,要求答对率在60%以上,即至少答对18题得24分(项目数30题、满分40分)。从这个意义上看,听力理解部分的应试表现在很大程度上直接影响考生能否过线。诚然,过线的关键在于考生应已具备相应的语言水平,达到大纲设定的评价目标的要求,这是首要条件,但不是唯一条件,正如人们常说的那样,有水平的人不一定考得好分数。测试是一个融认知、心理等诸多因素的技能过程,要求考生不仅具备相应的语言水平、而且掌握 相似文献
7.
基于项目反应理论的Lee分数分类方法对高考改革试点省市两种等级赋分方式的分类一致性和准确性进行研究。发现在IRT模型下,分类一致性和准确性指数受等级数量、划界分数位置、测验分数分布等因素影响,分数分类的一致性和准确性随分数等级数量的增加和分数向等级临界点靠近而呈现降低的趋势,随分数远离分数密集区域和分数远离测验均值而呈现增加趋势。建议后续改革省市在设定等级时,保持适中的等级数量,根据分数分布设定划界分数,试题命制应充分考虑考试的分数分布。 相似文献
8.
9.
一、问题的提出全国计算机等级考试是测试应试者计算机应用知识与能力的等级水平考试,属于标准参照考试。本文以该考试为例,谈谈标准参照考试分数线划分问题。我认为这个问题有两个互相独立的方面,一是不同次考试之间的分数等值,二是当次考试分数线调整。本文重点谈后者,因为前者人们谈论得较多,而对分数线调整的方法谈得较少,也不够深入。对于等值情形,本文只是在最后给出在这种情形下具体的分数线调整方法。研究分数线的划分方法具有理论和实际两方面的意义。作为一个理论问题,《考试大纲》规定60分及格, 相似文献
10.
11.
浅析全国计算机等级考试模拟软件评分系统 总被引:1,自引:0,他引:1
张红荣 《廊坊师范学院学报(自然科学版)》2009,9(1):44-45
“全国计算机等级考试(NCRE)”上机部分采用计算机自动评分的方式进行,评分功能的好坏直接影响着每个考生的考试成绩。针对“全国计算机等级考试”模拟软件中评分程序存在的问题进行详细地分析,对参加全国计算机考试的考生在具体答题时具有参考价值。 相似文献
12.
The purpose of this study was to compare several methods for determining a passing score on an examination from the individual raters' estimates of minimal pass levels for the items. The methods investigated differ in the weighting that the estimates for each item receive in the aggregation process. An IRT-based simulation method was used to model a variety of error components of minimum pass levels. The results indicate little difference in estimated passing scores across the three methods. Less error was present when the ability level of the minimally competent candidates matched the expected difficulty level of the test. No meaningful improvement in passing score estimation was achieved for a 50-item test as opposed to a 25-item test; however, the RMSE values for estimates with 10 raters were smaller than those for 5 raters. The results suggest that the simplest method for aggregating minimum pass levels across the items in a test–adding them up–is the preferred method. 相似文献
13.
本文介绍了心理测量理论与技术在美国医师执照考试中的应用情况,包括考生构成和及格率的简要描述;项目反应理论的基本要点及其在医师执照考试统计分析,题库建设、考试设计和组卷程序中的具体应用;测验分数等值化的方法,分数报告形式以及及格标准的制定程序。 相似文献
14.
运用时间序列分析的原理,通过对某高校若干年全国计算机等级考试成绩的分析,得到将来的计算机等级考试通过率的预报值,为教学管理部门对计划的制定及管理的安排进行定量的分析提供理论依据。 相似文献
15.
Lihua Yao 《Journal of Educational Measurement》2010,47(3):339-360
In educational assessment, overall scores obtained by simply averaging a number of domain scores are sometimes reported. However, simply averaging the domain scores ignores the fact that different domains have different score points, that scores from those domains are related, and that at different score points the relationship between overall score and domain score may be different. To report reliable and valid overall scores and domain scores, I investigated the performance of four methods using both real and simulation data: (a) the unidimensional IRT model; (b) the higher-order IRT model, which simultaneously estimates the overall ability and domain abilities; (c) the multidimensional IRT (MIRT) model, which estimates domain abilities and uses the maximum information method to obtain the overall ability; and (d) the bifactor general model. My findings suggest that the MIRT model not only provides reliable domain scores, but also produces reliable overall scores. The overall score from the MIRT maximum information method has the smallest standard error of measurement. In addition, unlike the other models, there is no linear relationship assumed between overall score and domain scores. Recommendations for sizes of correlations between domains and the number of items needed for reporting purposes are provided. 相似文献
16.
建构反应试题是自主招生考试的主要题型,其既有学业考查方面的优势,又有难以避免的评分误差。本文通过对2013年“华约”自主招生数学试卷的统计分析与质量评价,从总体评分、评分松紧度、评分趋中、量表等级限制、交互作用和侧面功能差异六个方面阐释建构反应试题评分误差产生的原因及其影响,在试卷评价的一致性、合理性和准确性的诉求下,提出在试卷的命制、评阅和反馈阶段消除和控制评分误差的建议,以提高我国基础教育的试卷评价质量。 相似文献
17.
为了解"五步辅导法"在高职护生护士执业考试培训中的应用效果,通过对参加2013年护士执业考试培训的护生进行培训前摸底考试,抽取402名护生,随机分为实验组、对照组,对照组采用传统教学方法培训,实验班采用"五步辅导法"培训。培训结束后,对模拟考试、全国护士执业考试通过率以及主观问卷调查方式对该辅导方式进行效果评价,结果显示:实验组护生模拟考试成绩和护考通过率与对照组相比明显偏高,主观问卷调查满意度与对照组相比也明显提高,差异具有统计学意义(P0.01)。证明该方法有助于提高教学效果,培养护生综合能力,提升护士执业资格考试应试水平。 相似文献
18.
Beth B. Krippendorf David L. Bolender Gary L. Kolesari 《Anatomical sciences education》2008,1(5):220-223
At the Medical College of Wisconsin, a procedure was developed to allow computerized grading and grade reporting of laboratory practical examinations in the Clinical Human Anatomy course. At the start of the course, first year medical students were given four Lists of Structures. On these lists, numbered items were arranged alphabetically; the items were anatomical structures that could be tagged on a given lab practical examination. Each lab exam featured an anatomy laboratory component and a computer laboratory component. For the anatomy lab component, students moved from one question station to another at timed intervals and identified tagged anatomical structures. As students identified a tagged structure, they referred to a copy of the list (provided with their answer sheet) and wrote the number corresponding to the structure on their answer sheet. Immediately after the anatomy lab component, students were escorted to a computer instruction laboratory where they typed their answer numbers into a secured testing component of a learning management system that recorded their answers for automatic grading. After a brief review of examination scores and item analysis by faculty, exam scores were reported to students electronically. Adding this brief computer component to each lab exam greatly reduced faculty grading time, reduced grading errors and provided faster performance feedback for students without changing overall student performance. Anat Sci Ed 1:220–223, 2008. © 2008 American Association of Anatomists. 相似文献
19.
学生成绩分布规律问题研究 总被引:1,自引:0,他引:1
考查学生学习情况好坏的依据目前基本上还是通过考试这种形式,那么,成绩自然而然的成为把握学生掌握知识点程度的量化指标。大学生在校期间的考试成绩可折射出学生学习努力程度、教师教学效果、试卷的质量和学校教学管理水平等。本文通过对我校的高等数学课程期末考试成绩进行统计分析,从理论上判定成绩分布不服从正态分布,用混合正态分布拟合考试成绩更加合理,达到更好掌握学生对知识理解和应用的程度,为教学和管理带来帮助。 相似文献
20.
方政蕊 《洛阳师范学院学报》2014,(8):125-127
本文主要利用数理统计学中的显著性检验的方法,对我院2010级和2011级理科专业的《数理统计》课程期末考试成绩进行对比分析,检验应用"任务驱动,主体参与"教学法进行教学对学生学习成绩是否有显著影响.结果表明,这种教学法不仅能显著提高学生的成绩和及格率,还可以缩短学生成绩之间的差距,是一种行之有效的教学方法. 相似文献