《考试与招生》杂志社
首页 > 期刊导读
 
/ / /
 

多项选择题的计分方法研究

 
来源:考试与招生 栏目:期刊导读 时间:2021-04-01
 
一、多项选择题是实现过程管理的必然选择 2018 年8 月22 日,教育部印发《关于狠抓新时代全国高等学校本科教育工作会议精神落实的通知》,对加强本科教育再次“加码”。《通知》要求严格本科教育教学过程管理,加大过程考核成绩在课程总成绩中的比重。 振兴本科教育,是一个复杂的系统工程。但在诸多举措中,考核是其中最为有效的抓手[1]。合理而且有力的考核方式是保障教育质量的最后一道防线,也是最稳固的防线。严格的考核制度会使考生早日明白,只有平时努力学习,才有可能在课终考试时取得好的成绩,这就有助于形成良好的学风。良好的学风会反映在课堂教学上,考生有不懂的地方就会问老师,力争把含混不清的地方彻底弄明白。考生们的认真求学就会促使老师认真执教,也就有利于形成端正、负责任的教风。学风和教风,是一个学校的校风的重要组成部分。校风是具有遗传性的,良好的校风很容易一届传一届。当一所学校具有良好的校风之后,各项教学、管理工作都会相对容易很多[2]。 要强化过程管理,提高过程考核成绩在课程总成绩中的比重,就必须有相应的技术保障。对于课程教学而言,有平时成绩可以作为过程管理的手段,但更重要的还是要进行学期过程中的单元考试[3]。如何在不过分增加教师工作量的前提下实现高频次的单元考试?解决这一难题的唯一方法可能就是考试的自动化。依靠信息技术,建立试题库,实现考试全流程的自动化。受目前人工智能的水平所限制,试题的类型只能是客观题。客观题有填空题、判断题和选择题,选择题又分为单项选择题和多项选择题。但是,填空题不能成为考题的类型。最重要的原因是语言的多意性造成判断时复杂度的增加,从而使判断更容易出现错误。判断题最大问题是猜对的概率太大了。仅仅凭瞎撞乱猜,也有一半的概率做对试题。多项选择题才是最佳的考题类型。虽然只是增加了多个正确答案的可能性,但是,多项选择题要比单项选择题难得多。不能准确地知道每个选项的对错,考生永远都不知道这道题目做完了没有。单项选择题则不然,只要能准确知道某一个选项绝对是正确的,其他的选项完全可以置之不理。 二、四种计分方法 在诸多选项中选择,能选中正确的一个或多个选项,是考生不同能力的表现。选对和选错也是有差别的,选对一个与选对两个也是有差别的。结合以往的考试和目前的研究,至少有以下四种计分方法可供参考。 (一)现行计分法 长期以来,多项选择题的评分规则就是0-1 分布,要么全对,要么全错。这是一种非常严格的计分方法,一个错误就会导致全盘皆输。之所以得以普遍采用,最主要的原因是容易操作。但这样做明显抹杀了考生之间的一些细微差别,积少成多,本来相差不大的两个考生,他们最终的成绩可能就是大相径庭。现行的计分方法应该有限制地使用。 (二)正负分法 选对了得分,选错的倒扣分,正负相抵后为最终得分。这种方法把分值平均分配给每一个正确的选项,以考生做了选择为基准,考生每选中一个正确的选项,就得到一份的分值;为了防止考生不负责任地全选,还必须加上惩罚措施。那就是,如果把错误的选项选中,则每选中一个就扣掉一份的分值。当考生选错的个数大于选对的个数时,本小题的得分就是负分;在计算整个试卷得分时,就需要拿在其他试题上的得分来填补这道题的亏空,正负相抵后才是这次考试的得分。 (三)保底法 参考正负分法,但不得负分,每一道选择题的最低分为零分。小题的分扣完即止,每一道小题都是一次重新开始。这种计分方法比正负分法稍微温和一些,而且可以区分考生选择时的细微差别。 (四)宽松法 用一种比较宽容的态度来看待多项选择题就会发现,“选对”当然是考生能力的体现;“弃错”也可以认为考生具备了某些鉴别的能力。譬如一道题目,考生不确定选项A 还是选项B 是正确的,但是可以肯定选项C 和选项D 一定是错误的。在这种情况下,无论考生最终的选择是A 还是B,按照以上三种计分方法,都不能把考生对选项C、D 的正确认识反映出来。宽松计分法的具体做法是,把小题分平均分配到四个选项中,如果是正确的选项而且考生又选中了,每选中一个得1/4 的分;如果是错误的选项而且考生没有选中,同样可以得1/4 的分。 三、数据分析 以2019 年春季学期我校某专业学生《离散数学》期中考试的157 份试卷为例(具体数据略)来比较这四种计分方法。这次考试共有50 道多项选择题,每小题2 分,满分为100 分,限时60 分钟完成。所使用的试题库中一共有275 道试题,考后随机收集到7850 道试题的做题信息。计算各种计分方法得到成绩的平均值,并做相关性分析,得到下表。 四种评分规则对比表 从上表的数据分析中发现,正负分法的成绩最低,宽松法得到的成绩最高。四条成绩波动曲线在成绩较低的时候差别比较大,在成绩较高的时候差别变得很小。这说明,现行规则下得分比较低的试卷,改用宽松法后成绩提升的幅度最大。 观察表中的相关系数会发现,四种计分方法相互之间最低的相关系数也超过了0.90。这说明采用任何一种新规则都不会对现行的评优体系造成太大的冲击。现在的好学生,即使是更换了计分方法,仍然会是好学生。差生亦然。同时发现,如果采用新的计分方法,却有可能大幅提高学生的平均成绩。如改用宽松法计分,学生的平均成绩就可以提高12 分之多(仅以此次考试为例)。 不同的评分规则还有助于培养不同类型的人才。现行的规则可以培养精确严密、高精尖的一流人才。宽松法则有助于谨慎细致、稳重保守的人才出头冒尖。国内一流的科研型学校应该继续采用现行的规则,培养精英型的高质量人才,而一般的本科院校则不妨改用宽松的计分法,让更多人才脱颖而出。 四、结语 多项选择题是信息化时代试题类型的必然选择。借助自动化的评阅工具,把多项选择题的优势充分发挥出来。针对不同的人才培养标准采用不同的计分方法,让各个层次的人才都有崭露头角的机会。还可以把不同计分方法得到的成绩综合分析,发现并确定各种类型的人才。 [1]崔允漷,王少非.学校课程实施过程中的评价监测初探[J].教育研究,2020(01):43-49. [2]周川.大学的德行:传统与现实[J].教育研究,2019(01):86-93. [3]孙彬博,郭衎,曹一鸣.信息技术与数学教学“深度融合”:理想与现实[J].教育研究与实验,2019(05):45-50. 一、多项选择题是实现过程管理的必然选择2018 年8 月22 日,教育部印发《关于狠抓新时代全国高等学校本科教育工作会议精神落实的通知》,对加强本科教育再次“加码”。《通知》要求严格本科教育教学过程管理,加大过程考核成绩在课程总成绩中的比重。振兴本科教育,是一个复杂的系统工程。但在诸多举措中,考核是其中最为有效的抓手[1]。合理而且有力的考核方式是保障教育质量的最后一道防线,也是最稳固的防线。严格的考核制度会使考生早日明白,只有平时努力学习,才有可能在课终考试时取得好的成绩,这就有助于形成良好的学风。良好的学风会反映在课堂教学上,考生有不懂的地方就会问老师,力争把含混不清的地方彻底弄明白。考生们的认真求学就会促使老师认真执教,也就有利于形成端正、负责任的教风。学风和教风,是一个学校的校风的重要组成部分。校风是具有遗传性的,良好的校风很容易一届传一届。当一所学校具有良好的校风之后,各项教学、管理工作都会相对容易很多[2]。要强化过程管理,提高过程考核成绩在课程总成绩中的比重,就必须有相应的技术保障。对于课程教学而言,有平时成绩可以作为过程管理的手段,但更重要的还是要进行学期过程中的单元考试[3]。如何在不过分增加教师工作量的前提下实现高频次的单元考试?解决这一难题的唯一方法可能就是考试的自动化。依靠信息技术,建立试题库,实现考试全流程的自动化。受目前人工智能的水平所限制,试题的类型只能是客观题。客观题有填空题、判断题和选择题,选择题又分为单项选择题和多项选择题。但是,填空题不能成为考题的类型。最重要的原因是语言的多意性造成判断时复杂度的增加,从而使判断更容易出现错误。判断题最大问题是猜对的概率太大了。仅仅凭瞎撞乱猜,也有一半的概率做对试题。多项选择题才是最佳的考题类型。虽然只是增加了多个正确答案的可能性,但是,多项选择题要比单项选择题难得多。不能准确地知道每个选项的对错,考生永远都不知道这道题目做完了没有。单项选择题则不然,只要能准确知道某一个选项绝对是正确的,其他的选项完全可以置之不理。二、四种计分方法在诸多选项中选择,能选中正确的一个或多个选项,是考生不同能力的表现。选对和选错也是有差别的,选对一个与选对两个也是有差别的。结合以往的考试和目前的研究,至少有以下四种计分方法可供参考。(一)现行计分法长期以来,多项选择题的评分规则就是0-1 分布,要么全对,要么全错。这是一种非常严格的计分方法,一个错误就会导致全盘皆输。之所以得以普遍采用,最主要的原因是容易操作。但这样做明显抹杀了考生之间的一些细微差别,积少成多,本来相差不大的两个考生,他们最终的成绩可能就是大相径庭。现行的计分方法应该有限制地使用。(二)正负分法选对了得分,选错的倒扣分,正负相抵后为最终得分。这种方法把分值平均分配给每一个正确的选项,以考生做了选择为基准,考生每选中一个正确的选项,就得到一份的分值;为了防止考生不负责任地全选,还必须加上惩罚措施。那就是,如果把错误的选项选中,则每选中一个就扣掉一份的分值。当考生选错的个数大于选对的个数时,本小题的得分就是负分;在计算整个试卷得分时,就需要拿在其他试题上的得分来填补这道题的亏空,正负相抵后才是这次考试的得分。(三)保底法参考正负分法,但不得负分,每一道选择题的最低分为零分。小题的分扣完即止,每一道小题都是一次重新开始。这种计分方法比正负分法稍微温和一些,而且可以区分考生选择时的细微差别。(四)宽松法用一种比较宽容的态度来看待多项选择题就会发现,“选对”当然是考生能力的体现;“弃错”也可以认为考生具备了某些鉴别的能力。譬如一道题目,考生不确定选项A 还是选项B 是正确的,但是可以肯定选项C 和选项D 一定是错误的。在这种情况下,无论考生最终的选择是A 还是B,按照以上三种计分方法,都不能把考生对选项C、D 的正确认识反映出来。宽松计分法的具体做法是,把小题分平均分配到四个选项中,如果是正确的选项而且考生又选中了,每选中一个得1/4 的分;如果是错误的选项而且考生没有选中,同样可以得1/4 的分。三、数据分析以2019 年春季学期我校某专业学生《离散数学》期中考试的157 份试卷为例(具体数据略)来比较这四种计分方法。这次考试共有50 道多项选择题,每小题2 分,满分为100 分,限时60 分钟完成。所使用的试题库中一共有275 道试题,考后随机收集到7850 道试题的做题信息。计算各种计分方法得到成绩的平均值,并做相关性分析,得到下表。四种评分规则对比表从上表的数据分析中发现,正负分法的成绩最低,宽松法得到的成绩最高。四条成绩波动曲线在成绩较低的时候差别比较大,在成绩较高的时候差别变得很小。这说明,现行规则下得分比较低的试卷,改用宽松法后成绩提升的幅度最大。观察表中的相关系数会发现,四种计分方法相互之间最低的相关系数也超过了0.90。这说明采用任何一种新规则都不会对现行的评优体系造成太大的冲击。现在的好学生,即使是更换了计分方法,仍然会是好学生。差生亦然。同时发现,如果采用新的计分方法,却有可能大幅提高学生的平均成绩。如改用宽松法计分,学生的平均成绩就可以提高12 分之多(仅以此次考试为例)。不同的评分规则还有助于培养不同类型的人才。现行的规则可以培养精确严密、高精尖的一流人才。宽松法则有助于谨慎细致、稳重保守的人才出头冒尖。国内一流的科研型学校应该继续采用现行的规则,培养精英型的高质量人才,而一般的本科院校则不妨改用宽松的计分法,让更多人才脱颖而出。四、结语多项选择题是信息化时代试题类型的必然选择。借助自动化的评阅工具,把多项选择题的优势充分发挥出来。针对不同的人才培养标准采用不同的计分方法,让各个层次的人才都有崭露头角的机会。还可以把不同计分方法得到的成绩综合分析,发现并确定各种类型的人才。参考文献[1]崔允漷,王少非.学校课程实施过程中的评价监测初探[J].教育研究,2020(01):43-49.[2]周川.大学的德行:传统与现实[J].教育研究,2019(01):86-93.[3]孙彬博,郭衎,曹一鸣.信息技术与数学教学“深度融合”:理想与现实[J].教育研究与实验,2019(05):45-50.

文章来源:考试与招生 网址: http://ksyzs.400nongye.com/lunwen/itemid-12368.shtml


上一篇: 与孩子聊聊考试
下一篇: 一般服务业论文_茶文化时代高校招生管理现状与创新



点击在线投稿

 
/ / /
 
 
 
 

Copyright 2001-2021 400农业期刊网版权所有 做最专业学术期刊论文发表网站
本站不是《考试与招生杂志社》官网,如果需要联系官方杂志社,请联系客服索取网站或者电话。