期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

陈睿《考试研究》2011,(6):59-67

国外考试项目的写作通常采用小评分量表综合评分法,国内则采用大评分量表综合评分或分项评分法。国外写作评分量表的描述具体、详细,层次清楚,各评分等级间的差别可鉴别,便于评卷者操作。与小评分量表相比,评卷者在大评分量表下不能使用全距分值,容易给出趋中分数,评分员间的评分一致性较差。据此,得出小评分量表下"整体描述+分项具体描述"的综合评分法较大评分量表的综合评分法准确度高,评卷者易于掌握,评卷效率高,评分误差小,考试的公平性也可以得到有效保障。相似文献

2.

评分趋中性现象的初步分析 总被引：1，自引：0，他引：1

DING Wen PEI Yun 《中国考试》2008,(8)

各类大型考试中的主观题由于题目要求灵活和考生答案多种多样,因此很难根据评分标准确保评分的准确性。利用网上评卷可以在某种程度上解决评分的误差问题,但仍发现存在着评分趋中性现象。本文通过对评分趋中性现象成因的分析,提出技术上进一步补充引入指标参数、不断完善评卷质量评价体系、系统中借鉴并设立评卷"外卡"机制等对策和措施,从而保证"个性化"评分的正常显现,减少"保险分",加强对评卷人员的人文关怀,充分发挥评卷人员的主观能动性,避免或减少趋中现象的发生,最终达到提高评卷准确性(有效度)的目的。相似文献

3.

高考语文写作整体评分与分项评分的实证研究

《中国考试》2020,(3)

高考语文写作采用的整体评分法导致写作试题区分度不高,其直接后果是高考语文的区分功能减弱。为改进整体评分法存在的不足,本研究设计分项评分方案,从论点、论据、论证、语言、思想5个维度对学生作文进行评分。通过比较整体评分和分项评分考生分数的差异,以及对评分员评分的一致性进行分析,得出:本研究设计的分项评分方案相较于整体评分,具有更好的分数离散度,能够更好发挥语文写作的区分功能,但是也存在仲裁比例过高的问题,需要进一步优化和改进。相似文献

4.

两种评分量表的评分效应比较研究

关丹丹陈睿张开赵静宇《教育研究与实验》2011,(4)

本研究运用多面Rasch模型对比分析了大、小两种评分量表下评分员的评分效应。结果显示,与小尺度评分量表相比,评分员在大尺度评分量表下不能使用全距分值,容易给出趋中分数;而且,在大尺度评分量表下评分员间的评分一致性较差。据此,提出应改进我国各项考试中写作评分量表的设置,并单独报告写作成绩的建议。相似文献

5.

考试写作评分模式与课堂写作评估模式的对比分析——兼评大学英语写作评估中分项评分法的优势

张青妹《语文学刊:高等教育版》2009,(2):129-131

完善的外语测试制度不仅能够对外语教学进行正确的评价,而且会对外语教学产生有力的推动作用。分项评分法用于大学英语课堂写作的评估中有其优势所在。通过对考试写作和课堂写作的评价模式进行对比分析,指出分项评分法适用于课堂写作,而综合评分法适用于考试写作评分,唯此才能对大学英语写作水平做出更为合理的评估。相似文献

6.

高考作文网上阅卷评分误差控制研究

蔡伟娄庆华《湖北招生考试》2008,(24)

网上阅卷是近年来兴起的利用现代技术控制主观题评分误差的方法,其在作文评分中误差控制的效果十分明显。网上阅卷主要通过评卷员之间一致性误差控制、评卷员本人一致性误差控制、两评的误差控制、评分点之间的误差控制、抽查监控等5种方法来实现评分误差控制,同时通过机控系统实施评分误差控制管理。随着研究的深入与技术的发展,将有可能实现基于互联网的高考作文评卷和计算机自动评卷,以进一步实现评卷误差控制。相似文献

7.

客观性试题评分方法的缺陷及改进

马小侠《渭南师范学院学报》2014,(8):55-60

客观性试题具有命题灵活性大、知识覆盖面广、考查内容偶然性小,评分标准统一、客观、准确,阅卷评分不受评卷人主观因素影响,易于采用计算机阅卷,提高评卷速度,降低考试成本等优点.然而,就其考核效果看,客观性试题除自身无法展示考生的语言组织能力、表达能力、思维过程及写作能力外,还存在一个较大的缺陷,就是无法规避考生猜测答案获取分数的投机行为.这种机会看似对于每一个考生均等公平,但其实不然.对客观性试题评分方法的缺陷作以分析,推算出求相应真实成绩的换算公式,以期得到命题形式的改进. 相似文献

8.

作文网上评分“三评法”初探

李银玲《考试研究》2013,(2):64-70

文章针对目前网阅环境下作文"一评"定分评分方法的缺陷,提出了将"三评法"应用于作文评分中。结果表明,"一评法"下,评分员间一致性不够理想,存在显著性差异。"三评法"在一定程度上降低了评分误差,确保了阅卷质量。但这种方法在实施过程中也要注意避免三评人员的求稳心理,以确保该方法得到科学合理的使用。对于该方法能否投入到大规模作文网上评分中,还有待进一步研究。相似文献

9.

英语口试中综合式与分析式评分的异同——基于考生话语的分析 总被引：2，自引：0，他引：2

兰春寿《福建师范大学学报(哲学社会科学版)》2008,(5)

本文依据Upshur and Turner（1999）考试与评分的理论模型,将考生口语产出的话语语言特征作为参照,研究口语考试中综合式与分析式评分的异同。实验结果表明考生口语产出的话语特征中流利度衡量指标之每分钟有意义音节数对两种不同评分模式都产生显著影响;评分员在两种评分过程中都注重考生话语的流利性,忽视语言准确性和复杂性。文章进一步对此进行了分析并从考生话语角度揭示口试评分中误差控制的问题。相似文献

10.

基于领域预训练的孪生网络智能评分方法

肖国亮马磊袁峰郭成锋《中国考试》2023,(4):78-85

随着信息技术的发展,主观题智能评分成为考试与测评领域的研究热点。基于深度学习的主观题智能评分方法目前尚存在一定局限性：一是基于深度学习的方法通常需要充足的训练样本才能达到比较好的效果,而一些真实阅卷场景却无法提供充足的标定样本;二是评分模型仅预测总分值,缺少评分细节,无法为后续的结果评价提供依据。针对以上问题,提出基于领域预训练的孪生网络智能评分方法,探索利用考生作答文本提高评卷精度的方法,探索得分点模型的可行性与实现方法。实验证明,孪生网络智能评分方法能够有效提高小样本情况下的主观题智能评分精度。相似文献

11.

田径跳远教学中模糊数学评分法的应用探究

《考试周刊》2016,(93):110-111

田径教学中跳远教学是一项极为复杂的运动项目。我国体育专业教学长期以来都是沿用传统的教学方式,教学的重点和评定通常是凭借教师的教学经验确定,这种教学方法往往会带有一定的盲目性,缺乏针对性和科学性。为了提高体育教学的整体水平,可以采用科学、合理的量化模式,本文运用模糊数学评分法对现有的教学进行分析,这种评分法符合体育教学的评分规律,对体育成绩的客观评价有一定的实用性效果,能够帮助教师清楚了解学生的体育技能。相似文献

12.

网络双评过程中作文评分误差以及评分者效应的分析——以大规模英语考试作文评分为例

《中国考试》2015,(2)

目前大规模考试作文评分大都采用双评评分模式,本研究采用多侧面Rasch模型(MFRM)分析双评模式下大型英语作文评分中的评分者误差来源及主要影响因素。对57名评分者所评价的2 427篇作文分析发现:1评分者的宽严度存在显著的差异;2在作文评分中,约有22.8%的评分者之间的一致性较差,也存在约3.5%的评分者之间一致性过高;3约90%的评分者自身的一致性都较高,但仍有8.8%的评分者自身一致性很差,约2%的评分者出现评分自身一致性过高的情况;4从整体上讲,评分者在不同的评分标准(或维度)上、不同评分等级宽严程度的把握存在差异;评分者和被试,以及评分者、被试和评分标准三者的交互作用不显著;5评分者对男生和女生具有相同的宽严度。相似文献

13.

评分员对不同体裁作文评分的多面Rasch模型分析

《考试研究》2018,(1)

主观性测试中,评分员差异是影响测试信度、效度和公平性的重要因素。本文采用多面Rasch模型考察8位评分员对记叙文和议论文两种体裁各60篇作文的评分情况。结果表明,评分员对不同体裁作文的评分存在不一致性:在评分员层面上,评分员的严厉度基本不受体裁的影响,但在评分员的信度与内在一致性方面,议论文评分好于记叙文评分;在评分量表层面上,评分员在评定语言和内容项目上,议论文比记叙文严格,而在条理项目上,议论文比记叙文宽松,并且议论文高分的使用频率比记叙文高。本文还就评分员评分的不一致性的原因进行了探讨,以求为降低评分偏差提供参考。相似文献

14.

基于多级评分的属性层级方法和广义距离法的认知诊断

祝玉芳王黎华《教育测量与评价(理论版)》2014,(12):9-13

基于等级反应模型的属性层级方法和多级评分的广义距离法,是两种基于项目反应理论的多级评分的认知诊断方法。本文通过采用Monte Carlo方法模拟比较两种方法的优劣,发现在四种属性层级结构、四种被试作答失误率情况下,对发散型来说,多级评分的广义距离判别法相对更好;对无结构型来说,基于等级反应模型的属性层级方法是更好的选择;对收敛型和线型而言,被试作答失误率比较大时多级评分的广义距离判别法相对更合适,其他情况下两种方法诊断效果差不多。相似文献

15.

正确理解英语写作测试的评分方法

赵妮娜闫丹《中国校外教育(理论)》2010,(5)

交流是学习外语的最终目的.语言测试在经历了几个发展阶段后,已从单纯追求考试信度过渡到注重考试效度.在笔试中提高考试的效度,意味着增加能直接测量考生语言能力项目的比重.写作能力的测试就通常通过这种直接测试的方法来衡量考生的写作水平.本文旨对英语写作测试的评分方法进行探讨. 相似文献

16.

历史科高考评分技术的改进

黄牧航《历史学习》2006,(11):42-44

在近二十多年的高考命题历史中,历史科主观题的评分方法大致可以分为两种:一是采点评分,二是层次评分。采点评分大家都很熟悉,其原理就是把参考答案细分为若干个落分点,然后以落分点为标准对照考生的答案,如果考生写出的字句与落分点相同或相近就可得分,否则就丢分。层次评分就是把参考答案从低到高分为若干个思维层次,阅卷教师不太在乎考生是否答对了相关的字、句,而是着重判断考生是否回答出与某个层次相近的意相似文献

17.

高考作文改革与评分误差控制:基于测量学的视角

《中国考试》2016,(5)

从测量学角度来看,高考作文因其评分主观性强影响了对考生写作能力甚至是语文能力的测量。如何改革作文才能进一步减小评分误差、提高考试的公平性,是落实此次考试招生制度改革的一项具体任务。研究一表明,与西方采用的小评分量表相比,我国高考采用的60分制大评分量表评分趋中效应更为严重,评分标准更为宽松,不同评分者对评分标准的掌握一致性较差,据此建议改革高考作文评分量表的设计,将目前的大评分量表改为小评分量表,成绩单独报告。研究二表明,增加作文任务数量有助于明显提高评分信度,据此建议将高考作文由一个大作文变为一大一小两个作文。相似文献

18.

论高校学生学业成绩评定方法的改进

周一玲《株洲师范高等专科学校学报》2001,6(5):91-92

衡量学生学习情况的好坏，应改变传统的学业成绩评定方法，可采用双向细目表来命题，评卷要按预定的程序和方法。论题的评分方法可采用相对评分法和分析评分法，同时，评分时还应考虑各门课程的相对重要性程度即权重，在总分求和时要考虑各门课程的权重。相似文献

19.

关于高考作文评分标准的反思与构想 总被引：1，自引：1，他引：0

纪荣海李军《福建基础教育研究》2011,(7):115-117

我国恢复高考以来,高考作文评分标准发展大致可分为四个阶段：第一阶段,整体评分,即列出几条评分标准,由评卷员根据整体印象评分。这一评分法最大问题是主观随意性大,误差大。第二阶段,分项分等评分,即把作文分成内容、语言、结构、文面四项,一、二、三、四、五个等次,然后进行分项评分。相似文献

20.

专家评分法在方案技术分析中的应用

孙乃聪《西安文理学院学报》2013,16(1)

由于新技术、新工艺在工程建设领域的不断涌现,为了减少其风险性,专家评分法在方案技术分析中越来越受欢迎.综合多数专家经验与判断,对大量难以采用技术方法进行定量分析的因素做出合理估算,这种方法既简便又直观.引用深圳某工程为工程实例,来展现专家评分法的优越性. 相似文献