赵曦

[摘           要]  目前高职学生综合素质评价多以简单的加权线性关系作为评价模型,这种评价依赖于经验或主观判断,利用数据挖掘算法,将学生的各类综合素质得分进行聚类分析,进而划分为不同的类别,弱化排名对学生综合素质评价带来的影响,使大学生综合素质评价更加科学、有效,为高校学生管理工作提供决策支持。

[关    键   词]  数据挖掘;综合素质评价;神经网络

[中图分类号]  G712                 [文献标志码]  A              [文章编号]  2096-0603(2021)23-0090-02

一、引言

开展全方位的素质教育是高职院校提升人才培养质量的主要手段,而如何科学系统地评价大学生的综合素质,是现代大学教育的一个重要研究课题。习近平总书记在全国高校思想政治工作会议上强调,“要重视和加强第二课堂建设,重视实践育人,坚持教育同生产劳动和社会实践相结合,广泛开展各类社会实践,让学生在亲身参与中认识国情、了解社会,受教育、长才干”。综合素质教育对训练学生开放的知识结构、多维的能力结构、不懈的探索精神,培养学生的开放思维、健全人格具有积极促进作用。目前高职院校综合素质评价体系仍存在指标僵化、不够客观等问题,主要是因为大学生的综合素质评价具有维度较大、过程复杂、个体发展不均衡的特点,并随着学生的成长,评价体系会不断动态进化,不同年级的学生评价标准不尽相同。研究如何对大学生综合素质进行科学、有效、系统的评价,并利用评价结果反作用于学生管理,对高职院校人才培养质量的整体提升具有重要的意义。

二、高职学生综合素质评价模型

高职综合素质评价中最常见的评价方案是将评价的指标和结果看作简单的加权线性关系,例如学年综合测评=学业成绩×60%+综合素质积分×40%。以此综合评测为依据,各专业年级依据学生测评得分的名次进行评优评奖,学校和各二级学院按测评总分高低进行审批入党、就业推荐等,并评选出优秀毕业生。而对于综合素质积分,一般通过选择多种评价指标,例如身心健康、创新创业、技术技能、人文艺术等,对这些指标数据还要再一次进行加权赋值。而对于评价结果来说,一般的做法是依据加权赋值之后的计算结果进行排名,或者用“优秀”“良好”“合格”“不合格”这样的等级作为定性结果。

这种局限于简单的赋权评价难以抓住以“职业道德素养、技术技能水平和就业创业能力”为核心要素和关键环节的高职教育关键点,因为实际上综合素质指标和结果之间是一个非常复杂的非线性关系。本文通过数据挖掘算法,寻找各类评价数据中的联系,弱化排名对学生综合素质评价带来的影响,使大学生综合素质评价更加科学、有效,为高校学生管理工作提供决策支持。

三、数据挖掘

数据挖掘就是从大量的样本数据中,寻找其规律的技术,一般可以分为描述和预测两类,可以分析出隐藏的但潜在有用的信息。数据挖掘的算法主要包括神经网络、决策树、仿生算法、粗糙集、模糊集、关联规则等,国内已有学者和专家利用数据挖掘技术对大学生综合素质教育数据进行研究[1],对高职学生综合素质评价的研究也取得了许多成果,也有学者结合学生大数据对高职学生综合素质评价体系进行研究。例如刘晓飞[2]、陈凤[3]等阐述了大数据在学生综合素质评价中的应用价值及创新构建优化测评模型。本文提出基于自组织特征映射神经网络 SOM[4]方法进行数据挖掘分析。

四、应用实现

神经网络是通过模拟人脑神经生理特性而建立的算法总和,该模型把神经元抽象为逻辑器件,把大量的神经元联结成网络结构,通过设置逻辑器件的阈值和权重来模拟复杂系统。20世纪80年代,神经网络进入高速发展时期,涌现出一系列重要成果:玻尔兹曼机、BP神经网络、并行计算理论、最大互信息理论、径向基神经网络等。神经网络在理论完善的同时,在模式识别、系统辨识、推荐系统、分类回归、图像与自然语言处理等应用方面也获得了极大发展。神经网络的知识信息以分布式的方式存储在各个连接权重上,部分神经元的损坏并不能带来太大的影响,具有较强的容错性。

SOM算法是人工神经网络的一种,最大的优点是不需要提供前期的标签信息,算法过程中能很好地保留输入层的拓扑结构。因此,可利用SOM处理高职学生综合素质评价得分结果差异,分别将个体样本归类到不同的组别,以组内差异小、组间差异大的方式进行聚类。聚类结果将学生划分为不同的类别,通过此结果作为下一步评测的依据。该方法比较传统的方法,避免了绝对排名的弊端,弱化了“唯名次论”对学生综合素质评价带来的影响。

SOM分为输入层和输出层两层。输出层的神经元采用竞争的方式激活,每个神经元有一个权值向量,输入层的每一个向量x会激活与之最接近的神经元,这个神经元叫作获胜神经元(winner)。输出层的所有的神经元组织成一个网格,网络的结构通常取决于输入的数据在空间中的分布,网格可以是四边形、六边形、链状等,可以由算法自行设定,一般情况的输出是一个二维的矩阵。

将SOM应用于高职学生综合素质评价,不同于通过计算每项分类的权重,然后再依据得分排名的方式,而是依据每一项综合素质评价得分结果差异,分别将其归类到不同的组别,以组内差异小、组间差异大的方式进行聚类,然后在不同的类别中再进行评价和认定。算法的具体步骤如下:

1.选取同一专业同一年级的数据,例如200个学生的分类得分数据作为数据样本,用作SOM算法输入,输入样本格式为: x=(x1,x2,……xn),其中7个维度分别代表思想政治、身心健康、创新创业、技术技能、人文艺术、志愿服务、劳动实践7个模块的得分,因此,神经网络的输入层节点个数设置为7。