首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 250 毫秒
1.
如何科学地确定合格标准是基于标准的教育考试关注的重要问题.我国传统上是以60分作为合格标准的划界分数,而国外发达国家大多是在考后通过专门标准设置的过程,再确定合格标准的划界分数.我国大规模教育考试传统上以60分作为合格标准划界分数,主要是因为在命题阶段采取了命题质量控制方法,使得刚合格考生的得分在60分附近.本研究以某市高等数学统考课程考试为例,在考前以传统60分合格标准为目标,在命题阶段采取命题质量控制方法,使得刚合格考生的得分在60分附近,而考后通过Angoff标准设置方法专门确定合格标准的划界分数,对比这两种方法过程和决策结果,进行了深入分析和探讨.研究结论表明:考前命题阶段的合格分数调整方法与Angoff标准设置方法在本质上具有相通之处,但两者结果却相差较大,基于标准的教育考试在考后通过专门的标准设置方法来设定合格标准更为科学和全面.  相似文献   

2.
《中国高校招生》2009,(5):12-13
江苏省学业水平测试必修科目考试近日举行,全省53.2万考生参加考试。 学业水平测试成绩实行等级计分,分为4个等级,用A、B、C、D表示。必修科目考试只要有一项科目为D等者(信息技术考试不合格视作D等),将不能填报高考普通类志愿。第一次报名参加必修科目考试单科成绩每得到一个A等级,则可在2010年高考总分中加1分,如得4个A,则可以加5分。  相似文献   

3.
自学考试命题中及格线的校准方法   总被引:2,自引:0,他引:2  
自学考试是标准参照性考试.是通过考察考生是否达到和掌握考试标准所规定的知识、技能和能力的要求来判定考生是否合格的.及格线的把握是否准确是自学考试命题质量的重要方面.控制及格线在自学考试中具有十分重要的理论和实践意义。在我国习惯于以60分作为及格线.因此控制及格线.就是尽可能使60分能够代表刚达标考生群体的水平.也就是说.刚达标考生群体作答试卷应获得60分的成绩。  相似文献   

4.
应用标准参照的理论对常模参照考试进行研究和解释,可以对考试进行更深入细致的分析。应用Rasch测量模型将考生的能力水平和不同版本的试题的考试分数转换到同一个分数系统上,可以进行不同年度间试题水平的比较和考生水平的比较。将学科能力分解为不同的维度,对各个维度的能力分成梯度等级,可以分析试卷中各试题的能力层级定位和试卷的能力结构,同时可以分析各层次考生的成分和比例。  相似文献   

5.
在新高考综合改革中,高中学业水平考试选考成绩作为高考成绩的组成部分。高考选考科目由于考生能力和题目难易度不同,原始分无法进行比较。如果各科使用标准分或者比例等级计分,虽然解决了题目难易度不同的问题,但因考生能力不同导致的计分不公问题会更加突出。为解决上述问题,提出了计分定级方式,在强假设和弱假设下分别得到选考科目的统计校准分数,然后让学科专家小组在此基础上设定专家校准值。根据选考科目在必考科目有成绩之前还是之后定级,分别给出等级赋分方法,从而解决考生选科时"避难选易"和"避强邻弱"的问题。  相似文献   

6.
听力理解(Listening Comperhension)是托福、全国英语水平考试(EPT)等大型语言测试不可或缺的重要组成部分,尤其对 EPT 而言显得格外重要,因为在 EPT 110分合格标准中包含有听力部分单独的合格标准,要求答对率在60%以上,即至少答对18题得24分(项目数30题、满分40分)。从这个意义上看,听力理解部分的应试表现在很大程度上直接影响考生能否过线。诚然,过线的关键在于考生应已具备相应的语言水平,达到大纲设定的评价目标的要求,这是首要条件,但不是唯一条件,正如人们常说的那样,有水平的人不一定考得好分数。测试是一个融认知、心理等诸多因素的技能过程,要求考生不仅具备相应的语言水平、而且掌握  相似文献   

7.
基于项目反应理论的Lee分数分类方法对高考改革试点省市两种等级赋分方式的分类一致性和准确性进行研究。发现在IRT模型下,分类一致性和准确性指数受等级数量、划界分数位置、测验分数分布等因素影响,分数分类的一致性和准确性随分数等级数量的增加和分数向等级临界点靠近而呈现降低的趋势,随分数远离分数密集区域和分数远离测验均值而呈现增加趋势。建议后续改革省市在设定等级时,保持适中的等级数量,根据分数分布设定划界分数,试题命制应充分考虑考试的分数分布。  相似文献   

8.
我国基于标准的教育考试的分类标准比较混乱,存在诸多争议。Bookmark法最早是由Mitzel等在2001年进行系统描述的基于项目反应理论的设置标准等第划界分数的方法,近年来在国际上得到越来越广泛的应用。文中先介绍Bookmark法标准设置的基本原理,以及执行Bookmark法的基本程序。然后,以高等教育统考课程《高等数学》为例,在考后利用Bookmark法进行标准设置,确定优、良、合格和不合格四个等第的划界分数。  相似文献   

9.
一、问题的提出全国计算机等级考试是测试应试者计算机应用知识与能力的等级水平考试,属于标准参照考试。本文以该考试为例,谈谈标准参照考试分数线划分问题。我认为这个问题有两个互相独立的方面,一是不同次考试之间的分数等值,二是当次考试分数线调整。本文重点谈后者,因为前者人们谈论得较多,而对分数线调整的方法谈得较少,也不够深入。对于等值情形,本文只是在最后给出在这种情形下具体的分数线调整方法。研究分数线的划分方法具有理论和实际两方面的意义。作为一个理论问题,《考试大纲》规定60分及格,  相似文献   

10.
计算机等级考试四级大纲编者按:全国计算机等级考试是由国家教委考试中心主办,用于测试应试人员计算机应用知识与能力的等级考试。1994年开始举办一、二、三级考试以来,已有数万名考生参加了考试。今年9月21日至26日将举行第四级考试。为使考生做好应考准备,...  相似文献   

11.
浅析全国计算机等级考试模拟软件评分系统   总被引:1,自引:0,他引:1  
“全国计算机等级考试(NCRE)”上机部分采用计算机自动评分的方式进行,评分功能的好坏直接影响着每个考生的考试成绩。针对“全国计算机等级考试”模拟软件中评分程序存在的问题进行详细地分析,对参加全国计算机考试的考生在具体答题时具有参考价值。  相似文献   

12.
The purpose of this study was to compare several methods for determining a passing score on an examination from the individual raters' estimates of minimal pass levels for the items. The methods investigated differ in the weighting that the estimates for each item receive in the aggregation process. An IRT-based simulation method was used to model a variety of error components of minimum pass levels. The results indicate little difference in estimated passing scores across the three methods. Less error was present when the ability level of the minimally competent candidates matched the expected difficulty level of the test. No meaningful improvement in passing score estimation was achieved for a 50-item test as opposed to a 25-item test; however, the RMSE values for estimates with 10 raters were smaller than those for 5 raters. The results suggest that the simplest method for aggregating minimum pass levels across the items in a test–adding them up–is the preferred method.  相似文献   

13.
本文介绍了心理测量理论与技术在美国医师执照考试中的应用情况,包括考生构成和及格率的简要描述;项目反应理论的基本要点及其在医师执照考试统计分析,题库建设、考试设计和组卷程序中的具体应用;测验分数等值化的方法,分数报告形式以及及格标准的制定程序。  相似文献   

14.
运用时间序列分析的原理,通过对某高校若干年全国计算机等级考试成绩的分析,得到将来的计算机等级考试通过率的预报值,为教学管理部门对计划的制定及管理的安排进行定量的分析提供理论依据。  相似文献   

15.
In educational assessment, overall scores obtained by simply averaging a number of domain scores are sometimes reported. However, simply averaging the domain scores ignores the fact that different domains have different score points, that scores from those domains are related, and that at different score points the relationship between overall score and domain score may be different. To report reliable and valid overall scores and domain scores, I investigated the performance of four methods using both real and simulation data: (a) the unidimensional IRT model; (b) the higher-order IRT model, which simultaneously estimates the overall ability and domain abilities; (c) the multidimensional IRT (MIRT) model, which estimates domain abilities and uses the maximum information method to obtain the overall ability; and (d) the bifactor general model. My findings suggest that the MIRT model not only provides reliable domain scores, but also produces reliable overall scores. The overall score from the MIRT maximum information method has the smallest standard error of measurement. In addition, unlike the other models, there is no linear relationship assumed between overall score and domain scores. Recommendations for sizes of correlations between domains and the number of items needed for reporting purposes are provided.  相似文献   

16.
建构反应试题是自主招生考试的主要题型,其既有学业考查方面的优势,又有难以避免的评分误差。本文通过对2013年“华约”自主招生数学试卷的统计分析与质量评价,从总体评分、评分松紧度、评分趋中、量表等级限制、交互作用和侧面功能差异六个方面阐释建构反应试题评分误差产生的原因及其影响,在试卷评价的一致性、合理性和准确性的诉求下,提出在试卷的命制、评阅和反馈阶段消除和控制评分误差的建议,以提高我国基础教育的试卷评价质量。  相似文献   

17.
为了解"五步辅导法"在高职护生护士执业考试培训中的应用效果,通过对参加2013年护士执业考试培训的护生进行培训前摸底考试,抽取402名护生,随机分为实验组、对照组,对照组采用传统教学方法培训,实验班采用"五步辅导法"培训。培训结束后,对模拟考试、全国护士执业考试通过率以及主观问卷调查方式对该辅导方式进行效果评价,结果显示:实验组护生模拟考试成绩和护考通过率与对照组相比明显偏高,主观问卷调查满意度与对照组相比也明显提高,差异具有统计学意义(P0.01)。证明该方法有助于提高教学效果,培养护生综合能力,提升护士执业资格考试应试水平。  相似文献   

18.
At the Medical College of Wisconsin, a procedure was developed to allow computerized grading and grade reporting of laboratory practical examinations in the Clinical Human Anatomy course. At the start of the course, first year medical students were given four Lists of Structures. On these lists, numbered items were arranged alphabetically; the items were anatomical structures that could be tagged on a given lab practical examination. Each lab exam featured an anatomy laboratory component and a computer laboratory component. For the anatomy lab component, students moved from one question station to another at timed intervals and identified tagged anatomical structures. As students identified a tagged structure, they referred to a copy of the list (provided with their answer sheet) and wrote the number corresponding to the structure on their answer sheet. Immediately after the anatomy lab component, students were escorted to a computer instruction laboratory where they typed their answer numbers into a secured testing component of a learning management system that recorded their answers for automatic grading. After a brief review of examination scores and item analysis by faculty, exam scores were reported to students electronically. Adding this brief computer component to each lab exam greatly reduced faculty grading time, reduced grading errors and provided faster performance feedback for students without changing overall student performance. Anat Sci Ed 1:220–223, 2008. © 2008 American Association of Anatomists.  相似文献   

19.
学生成绩分布规律问题研究   总被引:1,自引:0,他引:1  
考查学生学习情况好坏的依据目前基本上还是通过考试这种形式,那么,成绩自然而然的成为把握学生掌握知识点程度的量化指标。大学生在校期间的考试成绩可折射出学生学习努力程度、教师教学效果、试卷的质量和学校教学管理水平等。本文通过对我校的高等数学课程期末考试成绩进行统计分析,从理论上判定成绩分布不服从正态分布,用混合正态分布拟合考试成绩更加合理,达到更好掌握学生对知识理解和应用的程度,为教学和管理带来帮助。  相似文献   

20.
本文主要利用数理统计学中的显著性检验的方法,对我院2010级和2011级理科专业的《数理统计》课程期末考试成绩进行对比分析,检验应用"任务驱动,主体参与"教学法进行教学对学生学习成绩是否有显著影响.结果表明,这种教学法不仅能显著提高学生的成绩和及格率,还可以缩短学生成绩之间的差距,是一种行之有效的教学方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号