共查询到20条相似文献,搜索用时 15 毫秒
1.
国内外写作评分量表的对比研究 总被引:1,自引:0,他引:1
国外考试项目的写作通常采用小评分量表综合评分法,国内则采用大评分量表综合评分或分项评分法。国外写作评分量表的描述具体、详细,层次清楚,各评分等级间的差别可鉴别,便于评卷者操作。与小评分量表相比,评卷者在大评分量表下不能使用全距分值,容易给出趋中分数,评分员间的评分一致性较差。据此,得出小评分量表下"整体描述+分项具体描述"的综合评分法较大评分量表的综合评分法准确度高,评卷者易于掌握,评卷效率高,评分误差小,考试的公平性也可以得到有效保障。 相似文献
2.
评分趋中性现象的初步分析 总被引:1,自引:0,他引:1
DING Wen PEI Yun 《中国考试》2008,(8)
各类大型考试中的主观题由于题目要求灵活和考生答案多种多样,因此很难根据评分标准确保评分的准确性。利用网上评卷可以在某种程度上解决评分的误差问题,但仍发现存在着评分趋中性现象。本文通过对评分趋中性现象成因的分析,提出技术上进一步补充引入指标参数、不断完善评卷质量评价体系、系统中借鉴并设立评卷"外卡"机制等对策和措施,从而保证"个性化"评分的正常显现,减少"保险分",加强对评卷人员的人文关怀,充分发挥评卷人员的主观能动性,避免或减少趋中现象的发生,最终达到提高评卷准确性(有效度)的目的。 相似文献
3.
4.
5.
张青妹 《语文学刊:高等教育版》2009,(2):129-131
完善的外语测试制度不仅能够对外语教学进行正确的评价,而且会对外语教学产生有力的推动作用。分项评分法用于大学英语课堂写作的评估中有其优势所在。通过对考试写作和课堂写作的评价模式进行对比分析,指出分项评分法适用于课堂写作,而综合评分法适用于考试写作评分,唯此才能对大学英语写作水平做出更为合理的评估。 相似文献
6.
网上阅卷是近年来兴起的利用现代技术控制主观题评分误差的方法,其在作文评分中误差控制的效果十分明显。网上阅卷主要通过评卷员之间一致性误差控制、评卷员本人一致性误差控制、两评的误差控制、评分点之间的误差控制、抽查监控等5种方法来实现评分误差控制,同时通过机控系统实施评分误差控制管理。随着研究的深入与技术的发展,将有可能实现基于互联网的高考作文评卷和计算机自动评卷,以进一步实现评卷误差控制。 相似文献
7.
马小侠 《渭南师范学院学报》2014,(8):55-60
客观性试题具有命题灵活性大、知识覆盖面广、考查内容偶然性小,评分标准统一、客观、准确,阅卷评分不受评卷人主观因素影响,易于采用计算机阅卷,提高评卷速度,降低考试成本等优点.然而,就其考核效果看,客观性试题除自身无法展示考生的语言组织能力、表达能力、思维过程及写作能力外,还存在一个较大的缺陷,就是无法规避考生猜测答案获取分数的投机行为.这种机会看似对于每一个考生均等公平,但其实不然.对客观性试题评分方法的缺陷作以分析,推算出求相应真实成绩的换算公式,以期得到命题形式的改进. 相似文献
8.
文章针对目前网阅环境下作文"一评"定分评分方法的缺陷,提出了将"三评法"应用于作文评分中。结果表明,"一评法"下,评分员间一致性不够理想,存在显著性差异。"三评法"在一定程度上降低了评分误差,确保了阅卷质量。但这种方法在实施过程中也要注意避免三评人员的求稳心理,以确保该方法得到科学合理的使用。对于该方法能否投入到大规模作文网上评分中,还有待进一步研究。 相似文献
9.
英语口试中综合式与分析式评分的异同——基于考生话语的分析 总被引:2,自引:0,他引:2
兰春寿 《福建师范大学学报(哲学社会科学版)》2008,(5)
本文依据Upshur and Turner(1999)考试与评分的理论模型,将考生口语产出的话语语言特征作为参照,研究口语考试中综合式与分析式评分的异同。实验结果表明考生口语产出的话语特征中流利度衡量指标之每分钟有意义音节数对两种不同评分模式都产生显著影响;评分员在两种评分过程中都注重考生话语的流利性,忽视语言准确性和复杂性。文章进一步对此进行了分析并从考生话语角度揭示口试评分中误差控制的问题。 相似文献
10.
随着信息技术的发展,主观题智能评分成为考试与测评领域的研究热点。基于深度学习的主观题智能评分方法目前尚存在一定局限性:一是基于深度学习的方法通常需要充足的训练样本才能达到比较好的效果,而一些真实阅卷场景却无法提供充足的标定样本;二是评分模型仅预测总分值,缺少评分细节,无法为后续的结果评价提供依据。针对以上问题,提出基于领域预训练的孪生网络智能评分方法,探索利用考生作答文本提高评卷精度的方法,探索得分点模型的可行性与实现方法。实验证明,孪生网络智能评分方法能够有效提高小样本情况下的主观题智能评分精度。 相似文献
11.
12.
《中国考试》2015,(2)
目前大规模考试作文评分大都采用双评评分模式,本研究采用多侧面Rasch模型(MFRM)分析双评模式下大型英语作文评分中的评分者误差来源及主要影响因素。对57名评分者所评价的2 427篇作文分析发现:1评分者的宽严度存在显著的差异;2在作文评分中,约有22.8%的评分者之间的一致性较差,也存在约3.5%的评分者之间一致性过高;3约90%的评分者自身的一致性都较高,但仍有8.8%的评分者自身一致性很差,约2%的评分者出现评分自身一致性过高的情况;4从整体上讲,评分者在不同的评分标准(或维度)上、不同评分等级宽严程度的把握存在差异;评分者和被试,以及评分者、被试和评分标准三者的交互作用不显著;5评分者对男生和女生具有相同的宽严度。 相似文献
13.
14.
基于等级反应模型的属性层级方法和多级评分的广义距离法,是两种基于项目反应理论的多级评分的认知诊断方法。本文通过采用Monte Carlo方法模拟比较两种方法的优劣,发现在四种属性层级结构、四种被试作答失误率情况下,对发散型来说,多级评分的广义距离判别法相对更好;对无结构型来说,基于等级反应模型的属性层级方法是更好的选择;对收敛型和线型而言,被试作答失误率比较大时多级评分的广义距离判别法相对更合适,其他情况下两种方法诊断效果差不多。 相似文献
15.
交流是学习外语的最终目的.语言测试在经历了几个发展阶段后,已从单纯追求考试信度过渡到注重考试效度.在笔试中提高考试的效度,意味着增加能直接测量考生语言能力项目的比重.写作能力的测试就通常通过这种直接测试的方法来衡量考生的写作水平.本文旨对英语写作测试的评分方法进行探讨. 相似文献
16.
在近二十多年的高考命题历史中,历史科主观题的评分方法大致可以分为两种:一是采点评分,二是层次评分。采点评分大家都很熟悉,其原理就是把参考答案细分为若干个落分点,然后以落分点为标准对照考生的答案,如果考生写出的字句与落分点相同或相近就可得分,否则就丢分。层次评分就是把参考答案从低到高分为若干个思维层次,阅卷教师不太在乎考生是否答对了相关的字、句,而是着重判断考生是否回答出与某个层次相近的意 相似文献
17.
18.
周一玲 《株洲师范高等专科学校学报》2001,6(5):91-92
衡量学生学习情况的好坏,应改变传统的学业成绩评定方法,可采用双向细目表来命题,评卷要按预定的程序和方法。论题的评分方法可采用相对评分法和分析评分法,同时,评分时还应考虑各门课程的相对重要性程度即权重,在总分求和时要考虑各门课程的权重。 相似文献
19.
关于高考作文评分标准的反思与构想 总被引:1,自引:1,他引:0
我国恢复高考以来,高考作文评分标准发展大致可分为四个阶段:第一阶段,整体评分,即列出几条评分标准,由评卷员根据整体印象评分。这一评分法最大问题是主观随意性大,误差大。第二阶段,分项分等评分,即把作文分成内容、语言、结构、文面四项,一、二、三、四、五个等次,然后进行分项评分。 相似文献
20.
孙乃聪 《西安文理学院学报》2013,16(1)
由于新技术、新工艺在工程建设领域的不断涌现,为了减少其风险性,专家评分法在方案技术分析中越来越受欢迎.综合多数专家经验与判断,对大量难以采用技术方法进行定量分析的因素做出合理估算,这种方法既简便又直观.引用深圳某工程为工程实例,来展现专家评分法的优越性. 相似文献