抄袭检测系统对计算机类电子作业的影响分析
作者:祁俊 等
来源:《价值工程》2012年第24期
摘要: 计算机类课程的电子作业存在普遍的抄袭现象,给老师批改作业和评定分数带来了难题。针对计算机类课程的作业特点,利用作业检测系统对学生计算机类课程的电子作业进行了抄袭检测并进行深入分析。
Abstract: There is copy in electronic assignments of computer course. It is difficult for teachers to correcting and grading homework. Aiming at the features of computer course, we use homework detection system to detect students' electronic assignments of computer course and make deep analysis. 关键词: 电子作业;抄袭检测
Key words: electronic homework;copy detection
中图分类号:G642 文献标识码:A 文章编号:1006-4311(2012)24-0196-03 0 引言
随着计算机普及和信息化技术的飞速发展,各大高校都有各自的网络教学平台。信息化是高校教学改革的必然趋势。许多传统的教学方法和理念都在和信息化的技术相结合。一直以来的教学过程中,老师布置作业和批改作业是非常重要的教学内容。而在高校计算机类的课程中采用以往的纸质作业方式已不能满足计算机课程的特点。例如,程序设计课程实验中学生编写的源代码如果只采用纸质作业的方式,老师在批改过程中只能静态阅读程序代码而无法运行程序进行动态测试。因此希望将电子作业提交方便、随时批改等特点[1]结合到计算机类课程的实验作业中来。以青海大学为例(下简称我校)就已利用“教育在线”这一网络教学平台实现了对我校学生计算机类课程电子作业的提交和批改。 1 计算机类课程电子作业的实施和问题
电子作业指的是在校园网络环境下,学生按照教师的要求,利用计算机和网络等手段完成表现所学知识的多媒体数据。这些数据包括文字、声音、图形、图像、影像、程序、网页等多种媒体信息。作业的格式是各种计算机格式的文档、网页、程序等[2]。在我校计算机课程中电子作业主要针对的是学生在实验课程中完成的实验作业。
1.1 电子作业的实施 利用我校清华大学资助的“教育在线”网络教学平台,可以方便快捷的实现作业的布置、回收及批改。登录“教育在线”后本课程的所有教学资源都可共享。实验作业
龙源期刊网 http://www.qikan.com.cn
的提交可以是当堂提交到”教育在线”,也可以根据学生完成的实际情况和实验内容的难易程度课后提交。老师通过”教育在线”对学生提交的作业进行回收和批改。
计算机类的课程中作业的范畴可以是课后的习题和实验作业。课后习题中有很多概念性质的题目,这种类型的题目一般要求学生提交纸质作业。而在实验课程中计算机类的实验大多数是编程类,所以要求学生提交电子形式的作业。作业的格式为.C、.CPP、.DOC、.txt、.PDF等。根据每次实验的不同或者课程性质的不同,实验作业可以要求学生提交源程序代码或者实验报告文档。
1.2 学生作业中存在的问题 虽然电子作业这种形式对于高校计算机类的课程实验作业非常适用,但在具体实施过程中存在不少问题。特别突出的就是学生利用电子文件可随意拷贝的缺点来抄袭他人作业的现象。究其原因主要是大学生诚信缺失、功利心太强及学校考核方式单一等。作业本是为巩固课堂所学,弥补课时不足,为让学生熟练掌握知识所留,而在一部分学生当中变成了应付差事,如果不是考虑到争取比较好的平时成绩,可能少数同学根本就连应付都不应付了[3]。在老师批改实验作业时,雷同现象非常突出甚至于有很多人的作业代码一模一样。实验是计算机类的课程的重要部分,实验的效果是衡量学生对理论的理解程度和实践能力的标准。老师在批改实验作业后对分数的评定就尤为重要。希望能够从分数中反映出学生的实际水平。但由于抄袭现象的普遍存在,从学生提交的实验作业中很难反映出实际水平。给老师评定分数带来了很多不确定因素,同时分数缺乏公正也会影响学生的学习积极性。 2 电子作业抄袭检测系统的构建
2.1 系统构建的背景 如何杜绝抄袭?这是一个困扰着很多老师的问题,也是不同学科都存在的现象。从根本上去杜绝抄袭需要学校从多个方面去解决。首先是从道德层面上去加强学生的道德意识,加强大学生的诚信教育已经刻不容缓。其次是完善考核制度,增加考核方式等。另外,如何科学的评定学生的作业,从作业中发现抄袭者和雷同度是一个迫切解决的实际问题。基于这个角度,我校计算机系开发了电子作业抄袭检测系统,它的开发为老师“打假”提供了一个有力的工具,并为老师进行作业评定以及敦促学生自主学习起到了重要的作用。 2.2 系统设计的主要设计思路 目前并没有专门针对计算机类实验课程的电子作业抄袭检测的工具。本系统主要的设计思路是采用序列比对的方法来进行相似度计算,结合电子作业的特点对其进行量化和分析。实现了可以支持程序代码和文本的混合检测系统。算法的设计主要分为作业预处理、相似度计算、聚类分析三个模块。系统功能模块如图1所示。 3 应用及分析
计算机课程分为两大类:面向计算机专业学生的专业课程以及面向全校非计算机专业的计算机公共基础课程。从受众面广的非计算机专业学生学习的计算机基础课程中,挑选了 “程序设计基础(C)”课程进行作业检测的应用测验。检测的电子作业主要有两种格式:.C或.CPP的源程序文件、.DOC或.TXT的文本文件。
龙源期刊网 http://www.qikan.com.cn
3.1 检测步骤 第一步导入作业模板,模板可以是老师每次布置的实验内容和要求。或者是老师针对某些章节给出的程序框架。由于这一部分对于每个同学都是相同的,所以利用模板内容的相似度更方便于作业相似度的计算。第二步导入学生信息,学生信息主要包含学生学号和姓名两部分。可以由EXCEL中直接导入,已可以复制粘贴到检测系统中。第三步导入学生作业,学生作业格式可以是源程序文件或者文本文件。要求文件名以学生自己的学号命名。导入作业过程中用户从指定目录导入学生作业,系统根据学号进行自动匹配。第四步抄袭检测,根据用户事先设定的阈值对导入的学生作业进行相似度计算,并以二维表格和聚类图形的形式显示比对后的结果。
3.2 实验数据及分析 选取非计算机专业2010级两个班级为对象做了多次测试,选取其中一次实验来做阐述和说明。
3.2.1 不同班级同一目标作业测试 目标作业选取了《程序设计基础(C)》的第9次实验:字符数组和字符函数,并抽取有效作业若干。在A班被告知此次作业会被抄袭检测而B班没被告知的前提下进行测试结果如图2。实验结果分析如表1。
从测试结果可以看出:作业相似度两两比对的结果以二维表格的形式显示,并用红、蓝两种不同背景色代表相似度的强弱,检测结果一目了然。此次实验得出相同目标作业前提下不同班级的作业相似度值不同。在B班不知情的情况下平均相似度值远远高于A班。从对学生的作业检测情况中反映出了不同学生作业的完成情况及真实性,对于教师掌握学生个体的学习程度之间的差距有了直观的数据分析。从而可以随时调整教学并进行动态的跟踪。
3.2.2 同一班级相似度聚类分析 当相似度比对结果较多时,可以通过可视化聚类分析功能得到准确定位。根据检测结果对B班进行聚类分析,得出结果如图3。
从聚类分析结果得出的图示中可以直观的看出学生之间抄袭的情况。线段的粗细代表着两两之间的相似度并成正比。结合聚类的分析结果,确定抄袭学生的范围,然后根据老师观察学生的电子作业内容来确定抄袭。 4 对教学的影响
4.1 提高作业评定的效率和科学性 大学生作业的抄袭现象在各个学科中普遍存在。作为任课教师除了上课为学生教授知识外,还要对学生的学习进行监管。作业是敦促学生学习的一种有力教学手段,老师对作业的批改和评定是教学监管的有力体现。但如果老师对作业批改不认真或是评定结果“千人一面”就会大大放松学生的监管力度,同时也会影响学生对于学习的态度。然而大量雷同的作业仅仅通过老师的“肉眼”进行观察势必会降低老师批改作业的效率、准确率。通过电子作业检测系统老师就可以方便的批改学生作业,大大提高了作业的批改效率。同时根据检测结果来对学生的作业成绩进行的评定是有科学依据的。
龙源期刊网 http://www.qikan.com.cn
4.2 对学生的监督和警示 在此次实验中可以明显看出,被告知要检测的A班的同学抄袭现象就要远低于没被告知的B班同学。这说明抄袭检测可以从学生的心理角度来进行事先干预和防范。作为防止学生学习态度“不端”的有力工具,电子作业抄袭检测系统的公正性很大程度上杜绝了学生的抄袭行为,端正了学生的学习态度同时对学生的学习起到了监督和警示的功效。同时老师根据检测结果来“奖勤罚懒”、公平的评定学生的作业成绩也对学生的学习积极性起到了积极促进作用。 5 总结
电子作业检测系统设计的目的主要是为老师的教学提供有力的工具。对于学生希望起到监督和警示的作用。然而学生作业的抄袭现象单单通过检测工具的监管是远远不够的。要想从根本上解决这一现象还需从学生的心理、学习风气的建设、道德规范的教育以及老师考核方式的改革等等多方面来进行。 参考文献:
[1]胡明晓.一种带有抄袭识别的电子版实验报告管理系统[J].温州:温州大学学报自然科学版,2009,30(1):45.
[2]朱文耀.电子化作业的现实意义和实现[J].漯河职业技术学院学报,2005,4(3):25.
因篇幅问题不能全部显示,请点此查看更多更全内容