代码效率的自动评分和相似度检测的研究

被引量 : 0次 | 上传用户:sfish001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术和大规模在线教育的发展,计算机程序设计课程的无纸化考试得到了广泛的发展,计算机自动评测的优势也日益明显。相比于传统考试,计算机自动评测不仅可以减少巨大的财力和人力的消耗,还能避免在人工阅卷过程中由于人的主观原因造成的误评分。目前,基于客观题的自动检测技术已经相当成熟,主观题的检测方法也有了一定的发展。本文主要的研究内容是程序设计语言编程题的检测方法,从编程题的查重到自动评分技术进行了研究。本课题的主要工作包括以下几个方面:第一,根据代码语言的特性,将代码单词分成六类:符号、字符串变量、标准数、整型和实型、错误符号、编译指示字,其次从词法分析识别单词开始,结合使用词频-逆向文件频率(TF-IDF)算法获取学生代码文件集中的文本特征值,再通过语法分析获取学生代码文件的抽象语法树,在抽象语法树的基础上,仿照哈弗曼编码获取学生代码文件的结构特征值。第二,在文本特征值和结构特征值的基础上,提出基于潜在语义空间的代码相似度检测。联合使用文本特征值和结构特征值构成代码向量,使用基于学生代码集的代码向量构成代码矩阵,对代码矩阵使用奇异值分解获取其潜在语义空间,再在潜在语义空间上使用余弦相似度获取学生代码之间的六个类别的六个相似度值。最后在三份学生的代码作业基础上通过调参和设置阈值的方式来判断学生的代码是否存在抄袭现象。实现了一种高效的程序代码集到特征矩阵文本特征的提取算法,为线上教学提供了更好的教学质量保障,并且通过七组学生的代码作业对该算法进行测试,实验结果表明程序代码集到特征矩阵文本特征提取算法是可行的。第三,考虑到目前程序代码的自动评分方法都是基于结果集的,评分标准单一且缺少对于代码效率的考量。针对这一问题,提出了基于长短时记忆网络(LSTM)的代码效率的评分分类算法。根据代码程序在执行和存储时所消耗的计算机资源,提出把代码执行时花费的时间、代码运行所占的内存大小、代码所占硬盘大小这三个参数作为代码效率评判的标准。根据这三个参数的初始值的大小对程序代码集进行一个初分类,然后根据初分类的结果针对这三个参数使用DS证据理论进行标签的制作,最后利用LSTM网络完成对代码的分类评分,并且通过使用注意力机制来加强分类的结果。研究结果表明该分类评分方法可以为自动化评分提供多样化的考核标准。
其他文献
文章基于CSSCI核心数据库,利用Ucinet和CiteSpace文献计量方法分析了中国式现代化研究的历史变迁、热点趋势与未来展望。结果表明:中国式现代化研究经历了从萌芽探索的起步阶段,正在向深化发展的新阶段转变;研究成果丰硕,整体呈现校内“合作密切”、校际“单打独斗”的特点;研究主题主要体现在人口规模巨大、全体人民共同富裕、物质文明和精神文明相协调、人与自然和谐共生以及走和平发展道路五个方面。未
采用面向对象方法,利用1989年、2000年、2010年和2020年江西省60景Landsat TM/ETM/OLI遥感影像数据,提取4个时期江西省土地利用信息;利用湿地景观动态变化指数、湿地动态强度指数、景观指数和土地利用转移矩阵,得到了4个时期江西省各类型湿地分布、面积和景观指数特征;采用地理探测器,确定了影响湿地的主要因素。研究结果表明,随着时间的推移,4个时期江西省湿地总面积总体在减少,由
随着国民经济和收入水平的提升,国民对精神和文化展开了更深层次的探索和追求,地区特色文化和异质文化的吸引力逐渐增加。文化和旅游的融合作为一种新业态,贴合市场需要,为游客提供了更具内涵的旅游体验。在国家政策的大力扶持下,文化和旅游的融合也为城市的经济发展提供了新的渠道。但是与其他城市相比较后可知,菏泽市文化旅游发展较为缓慢,市场活力不足。因此,本文以游客满意度作为研究视角,立足于游客满意度和文化旅游融
《反家庭暴力法》自2016年实施以来已有六个年头,越来越多的人民法院开始核发人身安全保护令,将家庭暴力受暴者的司法保护工作推向了前所未有的广度与深度。但保护令制度作为一个新兴的“舶来品”,法官在核发保护令过程中不可避免会因立法不明确、法官考量以及法院内部工作机制不合理等因素而遭遇核发困境。笔者以审结日期在2020年1月1日至2020年12月31日期间的899份保护令申请审查裁定书为研究对象,通过审
<正>前言2022年8月21日,《中国招标》杂志社举办了第二届招标采购前沿论坛。来自全国各地的近200位专家学者、招标采购从业人员和招标采购行政监督人员与会。本人有幸连续两年参加该论坛,并作主旨发言。在今年的论坛上,本人作了“修订后的《政府采购法》对采购方式的创新”的主旨发言。现将发言内容呈现给读者,欢迎批评指正。
期刊
[目的]为了解北疆某牧场奶牛隐性乳房炎情况及分析其可能存在的风险因素。[方法]2020年1月至2022年9月通过加州乳房炎检测法(CMT)对该牧场在群泌乳牛进行隐性乳房炎调查,并初步分析该场可能存在的主要风险因素。[结果]该牧场2020—2022年各年奶牛隐性乳房炎平均阳性率分别为3.69%(110/2980)、5.01%(150/2 993)和3.87%(86/2 220);乳区阳性率分别为0.
<正>(2022年8月12日)尊敬的杨洁司长、于文涛副司长、李威总经理,各位代表:大家下午好!2017年,中国招标投标协会(以下简称中招协)首次搭建央企会员单位交流平台,今年的会议是该平台的第六次交流活动。平台的交流活动受到了大家的重视和欢迎,杨洁司长连续两年亲自出席交流会并作重要讲话,说明了国家部委对我们央企采购活动研讨的重视。刚才杨洁司长在会上作了重要讲话,
期刊
自身免疫性脑炎(autoimmune encephalitis,AE)是机体免疫系统对神经元抗原的反应所致的神经系统疾病,并且该病逐渐被认为是非感染性因素致可逆转性脑炎的重要原因。在临床实践中,对以症状表现为急性或亚急性起病的认知功能障碍、精神行为异常、癫痫发作的患者,临床医生通常会考虑到自身免疫性脑炎的诊断。若不能及早明确诊断,常会延误治疗,导致高致残率与高致死率。随着对AE的重视以及对其发病机
伴随着世界范围内航空运输业的发展,催生了“代码共享”航班运营模式,即一家承运人通过协议在航班上使用其他航空公司代码,或两家承运人通过协议在同一航班上共享同一航空公司代码,因此,某个架次航班上的乘客,所买的票可能来自多家航司。目前,代码共享的运行模式已成为全球航空运输业内最流行的合作方式。代码共享航班信息的管理,是一个涉及多个航司航班信息的分布式系统。然而由于没有一个集中控制、双方互认的权威机构做认