"景先生毕设|www.jxszl.com

作业查重算法研究与系统开发【字数:9010】

2024-02-25 16:53编辑: www.jxszl.com景先生毕设

目录
摘要 1
关键词 1
Abstract 1
Key words 1
1 绪论 2
1.1 选题背景、意义 2
1.2 国内外研究现状 2
1.3 研究内容 2
1.4 论文组织结构 3
2 需求分析 3
2.1功能需求 3
2.2系统模块 3
3 设计流程及思想 4
3.1 设计思想 4
3.2 系统设计总流程图 5
4 开发平台及应用技术 5
4.1 IntelliJ IDEA简介 5
4.2 mySQL数据库 5
4.3 JDBC简介 6
4.4 Jieba分词 6
4.5 基于kgram的Winnowing算法提取文本特征 6
4.5.1 kgram model简介 6
4.5.2 hash算法 6
4.5.3 Winnowing算法 6
4.5.4 Winnowing算法查重过程的具体实现 7
4.6 基于murmurhash的Simhash算法 8
4.6.1 murmurhash算法 8
4.6.2 Simhash算法 8
4.6.3 Simhash算法查重过程的具体实现 9
5 学生作业查重系统总体设计 10
5.1系统结构设计 10
5.1.1 类的设计 11
5.1.2 系统用例图 11
5.1.3 系统活动图 13
5.1.4 系统顺序图 16
5.2 数据库设计 19
5.2.1 数据库概念结构设 19
5.2.2 数据库逻辑结构设计 23
6 系统实现 26
6.1 功能实现和相应页面 26
6.1.1 登录页面 26
6.1.2 管理员用户界面 26
6.1.3 学生用户界面 28
7 总结与展望 34
 *51今日免费论文网|www.jxszl.com +Q: ^351916072
7.1 系统总结 34
7.2 展望 35
致谢 35
参考文献 35
作业查重算法研究与系统开发
计算机科学与技术学生 张义磊
引言
绪论
选题背景、意义
现在的人们更倾向于从电脑,手机和物联网上获取资源,解决问题时已经养成了使用网络搜索引擎来查找答案的习惯。互联网打破了国与国之间的界限,人们有机会获得世界各地的电子读物。特别计算机编程领域,源代码的分享十分普遍,像Github,CSDN论坛等计算机论坛上开源的源代码非常容易获得,且覆盖面非常广。
本设计的主要工作是对大学程序语言教学中编程作业抄袭问题进行讨论,再对现在比较流行的查重算法进行研究,最后开发出一套可以运用的学生作业查重系统。
1.2 国内外研究现状
国外的代码作业查重系统如SIM[3],JPlag,MOSS[4]等在处理代码查重时效果不错。代码文本之间的相似度的研究最早是Halstead基于所提出的基于软件科学度而提出的属性计数法。Grier提出了ACCUSE[5]。G.Whale的Plague提出的代码检测系统是基于结构度量设计的[6]。
比较传统的检测文本相似度的方法是通过对一篇文档的全部词汇的词频和逆文本频率指数进行统计,作为文章的空间向量,最后计算文章之间的欧式距离或者余弦距离,从而计算出文本相似度;还有一种方法是提取文档的部分特征,运用jaccard距离来计算相似度。
国内张文典等人开发了国内最早的代码抄袭检测系统,其主要算法是属性计算法[7]。之后赵长海提出了基于反汇编的程序相似度检测方法[8],内蒙古师范大学的程金宏采用XML文档对程序代码进行标记生成[9]。
1.3 研究内容
设计原则为以下几项:
(1)当用户登录系统时,可以非常快的上手。系统功能尽可能全面。让界面尽可能的美观,整洁。
(2)查重精确度尽可能准确,查重操作尽可能高效。对上传的作业进行保存,对作业进行数据预处理,查重处理,选用尽可能高效的算法,对作业进行查重。
(3)查重结果展示清晰,直观,便于用户分析处理。
1.4 论文组织结构
第一章 绪论。本章主要介绍为何选择学生作业查重系统作为本人的毕业设计的原因,和这个课题的意义,然后对查重方面的研究的国内外的现状进行介绍、概括,再介绍本设计的研究目的和内容,并给出了本次论文的组织结构。
第二章 系统需求分析。本章论述了系统中各个主要用户的主要需求,从容总结出各个用户的主要功能,并采用软件工程的设计思想给出系统模块图。
第三章 设计流程及思路。本章论述了在清楚需求后对如何实现这个系统的整体思路的分析和介绍。
第四章 开发平台及应用技术。从IDEA开发平台,JAVA web项目技术,jieba分词,Winnowing 算法和Simhash算法等几个方面简要介绍了本课题用到的关键技术理论。
第五章 学生作业查重系统系统介绍。本章从系统中不同核心用户的角度出发,通过用例图对不用用户所能完成的功能进行介绍。再通过活动图,顺序图对本系统中的主要操作进行详细描述,最后对数据库设计进行介绍。

原文链接:http://www.jxszl.com/jsj/jsjkxyjs/563879.html