论文部分内容阅读
近年来,高校学生问题频繁发生,各类学生事件发人深省,已引起社会各界的高度关注。如何从基数大、活动广、个性强的校园学生群体中有效识别校园内潜在的、非常规的学生异常行为,已成为校园问题的研究重点。而校园大数据的有效存储、数据挖掘及可视化技术的快速发展,为本文利用学生生活数据进行异常行为的探索分析和可视化提供了新的解决思路。然而,现有学者对学生异常行为的挖掘多侧重于宏观性分析,而对学生异常行为检测及其可视分析的研究较少。基于此,本文基于北京市某高等学校学生行为数据,包括:消费数据、淋浴数据、充值数据、图书馆借阅数据、图书馆门禁数据、网络浏览数据等,提出一套学生异常行为探索、异常关联分析及可视化的方法,以自动检测校园内学生异常活动;并在此基础上,通过关联性度量异常个体间的群体关联性,来寻找校园内存在相似行为的学生群体。本文选定全校范围内的本科生样本进行实验,并向指定辅导人员获取先验异常学生群体信息,来验证论文实验结果的可靠性。本论文主要包括以下三方面的研究内容:(1)基于无监督聚类的学生异常个体检测。本文通过对校园学生生活行为进行特征提取及表示,利用聚类方式实现了基于生活行为的学生群体无监督分类,并定义相对异常因子以检测出可能存在的异常个体。利用本方法对2017学年在校本科生(N=8,685)数据进行异常行为检索。在可掌握行为信息的学生中,进行针对个体行为的定性分析,通过向相关辅导员询问的方式进行验证,得到学生存在长时间旷课、离校、校园活动不规律等异常行为。实验结果表明,该方法可为校园管理者进行异常行为个体检索提供准确判断。(2)基于模块度最优的学生群体关联分析。首先提出三种度量学生相似性算子,计算全校本科生范围内任意两个学生的行为相似性,所提出的时空相似性算子度量准确率高达87%;然后使用个体间时空相似指数作为特征,利用群体模块度最优算法进行学生群体关联分析,挖掘满足模块度最大值情况下,校园内存在的具有相似时空特性的群体,以向相关辅导员询问的方式进行验证,实验得到群体内关联度较高学生存在共同寝室、情侣、生活密切等关系。该方法可根据异常个体检测结果进行异常群体检索。(3)学生异常行为可视化。通过特征描述、时空关联、异常个体探索等可视化方式,对校园内存在的异常行为进行分析。利用时空相似性算子,构建学生弦连接、均匀连接关系图,度量学生间时空关联性;利用相对异常因子以及个体间时空关联性构建异常个体图、关联异常图,探索校园内存在的异常个体及群体。结合前两部分所得结果,该可视化方法验证了第一部分所得到的社会关系较少、生活孤立等异常学生个体,以及第二部分所得到的存在密切关联关系的群体。该方法为异常个体及群体关联分析提供新的分析方式。本文提出学生个体及群体异常行为探索方法,可利用校园生活数据,通过学生异常个体检测、学生群体关联分析以及可视化等方式,探索校园内存在的异常行为。研究结果可为校园异常行为的监测和管理工作者提供更科学的理论支撑和更精准的决策支持。