周金堂 章胜江 黄恩平

摘要:在我国高等教育跨过大众化门槛,迈入普及化的阶段,高校人才培养将从量的扩张向提质培优方向转变,如何适应新的变化趋势,更多更好地培养高质量人才是摆在高校教育管理部门面前的一个重要课题。在长期的教育管理实践中,摸索发现创新教育管理信息化方式对提高人才培养质量的正向作用。针对以往教师对学生成绩的分析处理一般仅仅是统计成绩处在优、一般、差级别的人数,而对每个学生具体擅长与不擅长的课程往往无法了解。运用本校基于数据挖掘的教育管理信息化平台后,不但能够精准了解每个学生的擅长课程与不擅长课程,而且对教学质量的提高起到积极的促进作用。南昌职业大学通过数年的使用,大大提高了教育管理效率,增强了教育管理针对性,促进了学生培养质量明显改进。

关键词:教育管理;创新;信息化;高校;人才培养

中图分类号:TP3      文献标识码:A

文章编号:1009-3044(2021)03-0177-03

2019年,我国在校生规模达4002万人,随着我国高等学校的学生数量的增长,学校教育教学管理带来许多新的问题和挑战。如高校教育管理部门对学生的课程擅长情况往往不能准确把握,导致无法对症下药解决学生偏科严重的情况,由此可见挖掘出学生擅长的科目显得尤为重要。事实上,从我国高等学校学生经过大量的考试积累了大量的数据,利用这些数据理性的分析学生的成绩是否符合正常预期,对高等学校根据学生的考试成绩来判断该学生对该门课程的掌握情况变得特别重要。数据挖掘技术能从许许多多的数据中发现潜藏在其中的规律,这些规律对于判断学生是否擅长该门课程或者对该门课程的擅长情况的判断具有很强的表现力。利用数据挖掘技术从数据库中提炼出可靠性的信息可以检测学生对特定课程的擅长情况。学生成绩分析处理之中有大量间接或直接的数据统计,涉及人才的管理方面以及学生选课的引导、学生成绩的预测分析等内容。通过数据挖掘技术,得出一些有价值的信息,全面、客观、科学地供教育管理部门参考。二十一世纪,数据库技术获得了突破性的成果并且得到大范围的应用。海量的信息在给人们带来便捷的同时也带来了一大堆困难:第一是信息过量,难以消化;第二是信息虚实难以辨别;第三是数据的安全很难得到保证;第四是数据形式的不统一,很难得到统一的处理。如何从含有海量信息的数据库中提取高质量的、隐含的信息来帮助决断出未来能够到达信息处理的更新兴的要求,南昌职业大学经过多年的实践,把数据挖掘技术应用于高等学校的教育信息化管理中,达到了很好的效果。南昌职业大学开发的教育管理信息化平台根据学生课程成绩以及他所在年级的所有学生的课程成绩,来分析预测该学生对该门课程的擅长程度。通过学生成绩构建决策树模型,某个特定学生的课程成绩及年级所有学生同课程的成绩作为训练集的输入,该学生对特定课程的擅长情况作为训练集的输出。当用户输入学生学号时,平台给出反馈信息,给出该学生对特定课程的擅长情况等。

1 学校教育管理信息化平台建设

“规模是一切问题的根源。”“量的增长必然引起质的变化。”在提升大学治理体系和治理能力现代化的大背景下,同步开发的基于数据挖掘的教育管理信息化平台主要是解决我校教育管理部门对学生成绩情况了解不够清楚问题,对学生偏科情况通过统计表反映不够直观问题。运用平台根据学生课程成绩以及他所在年级的所有学生的课程成绩,通过决策树算法来分析预测该学生对该门课程的擅长程度,从而直观明了地反映出学生对课程成绩掌握的情况,即达到对学生成绩分析的目的;该平台还针对整个班级来分析班级的成绩情况,让班主任也能够直观了解班里的情况,不是简单地通过Excel统计表来发现班级情况,而是以各种图形呈现出班级成绩的情况,包括及格人数、优秀人数等等。同时教育管理部门还能够对学生课程成绩进行管理,包括对学生课程成绩进行增删改查以及对学生课程成绩按姓名、学号、班级以及课程名等进行模糊搜索等。

1.1 决策树算法防止欠拟合与过拟合

1.1.1 防止欠拟合的方法

1)增加特征数

当特征不足或者现有特征与样本标签的相关性不强时,模型易出现欠拟合。可以通过挖掘上下文特征,ID类特征,组合特征等新的特征,可以取得较好的效果。

2)增加模型复杂度

模型简单时其表达能力较差,容易导致欠拟合,因此可以适当地增加模型复杂度,使模型拥有更强的拟合能力。如线性模型中添加高次项,神经网络中增加网络层数或神经元个数。

3)减小正则化系数

正则化是用于防止过拟合的,但是当出现欠拟合时,就有必要针对性地减小正则化系数。

1.1.2 防止过拟合的方法

1)增加训练集数据

该方式是从数据入手,将更多的数据参与到模型的训练中,这是最有效的方法,这样可以让模型学习到更多更有效的特征,降低噪声对模型的影响。但是往往直接增加数据是困难的,因此可以通过一定的规则来扩充训练数据。

2)降低模型复杂度

在数据量较少的情况下,模型过于复杂将会导致过拟合,因此可以通过降低模型的复杂度来防止过拟合,这样就可以一定程度上避免模型拟合过多的采样噪声。

3)增加正则化约束项

将权值的大小加入损失函数中,避免权值过大带来的过拟合风险。

4)通过集成学习的方式训练模型

集成学习是把多个模型集成到一起来作为共同的模型,可以降低单一模型的过拟合风险。

1.2 核心功能

1.2.1 个人成绩分析模块

该模块采用决策树算法对学生个人成绩进行分析,当输入指定学生的学号,平台以柱状图的形式反馈出学生所学的各科目的擅长情况,并给出提示语,告知该学生的课程情况以及具体分数,柱状图给人以直观的感觉,让用户一眼就能知道该学生的课程擅长情况,同时采用决策树算法比普通的简单的sql分析具有更为可靠的优点,个人成绩分析如图1所示。

关键代码:

for each in data_user:

each_tmp = []

each_tmp.append(str(each[0]).replace("xm", ""))

each_tmp.append(course_dict.get(str(each[1])))

if float(each[2])>80:

each_tmp.append(1)

else:

each_tmp.append(0)

y_train.append(each_tmp)

sql_user = "select studentId,grade_list.course as course,score from grade_list where studentId = '{0}'; ".format('xm16211571')

cursor.execute(sql_user)

data_user = cursor.fetchall()

x_test = []

if data_user:

for each in data_user:

each_tmp = []

each_tmp.append(str(each[0]).replace("xm",""))

each_tmp.append(course_dict.get(str(each[1])))

each_tmp.append(str(each[2]))

x_test.append(each_tmp)

estimator = DecisionTreeClassifier(criterion="entropy")

estimator.fit(x_train, y_train)

joblib.dump(estimator, "train_model.m")

y_predict = estimator.predict(x_test)

1.2.2 班级成绩分析模块

该模块采用对数据库的查询操作来实现对班级成绩进行分析,当输入班级时,系统以柱状图的形式反馈出本班级学生的课程成绩情况,告知该班级的课程情况以及班级每门课的平均分,班级85分以上人数以及班级不及格人数并能把图片保存下来供长期的研究分析,班级成绩分析如图2所示。

班级成绩分析关键代码:

cursor = db.cursor()

sql_user = "select studentId,grade_list.course as course,score from grade_list join (select course from grade_list where studentId = '{0}')t on grade_list.course = t.course;".format('xm16211571')

cursor.execute(sql_user)

data_user = cursor.fetchall()

course_dict = {}

course_dict_2 = {}

i = 1

if data_user:

for each in data_user:

each_tmp = []

each_tmp.append(str(each[0]).replace("xm",""))

if not course_dict.get(str(each[1])):

course_dict.update({str(each[1]):i})

course_dict_2.update({i:str(each[1])})

i = i+1

each_tmp.append(course_dict.get(str(each[1])))

each_tmp.append(str(each[2]))

2 疫情期间的线上教育管理与信息化

疫情期间,运用教育管理信息化平台,南昌职业大学采取听课、评课、巡课和陪课的方式,加强线上教学管理。教师采用腾旭课堂、钉钉、腾讯会议和QQ直播等工具进行线上教学。各院系的班主任将任课教师拉入班级群,任课教师利用钉钉群上传课前任务和课后作业,学生在钉钉群完成课前任务和课后作业,任课教师利用钉钉直播进行课堂教学,钉钉群进行答疑和反馈,并在钉钉群上传教学课件和电子书,钉钉群公告发布重要通知和相关链接。

在课堂教学过程中,运用钉钉直播,可以随时监测学生是否认真听课,例如,在讲到Android应用程序架构时,逻辑控制层与表现层分开设计,会提问学生这个架构和你们学过Java课程中的哪个非常类似,并给出两个选择备选答案,学生在钉钉群里只要回答1还是2就可以,这样,就能及时掌握有多少人在听课,凡是群里及时回答1或2的同学,说明在认真听课,凡是没有回答的同学,很可能是在挂钉钉上课人不在。下课后,会把按时回答的同学名字登记下来,并保留截图,这样就清楚有多少人在认真听课,同时,也能得到谁没有听课,只是挂机,得到数据后,每次上课前,都会把名单公布,并告诉学生:每次课采取的方式和方法都会不同,而且告诉学生,线上上课出勤和认真程度占我这门课的比重很大,如果出现一次课不认真听,被查到扣10分。从而,学生们都非常重视线上教学,通过抽查的方式,发现学生听课效果非常好,几乎都能在极短时间内和任课教师互动,完全可以保证线上课堂正常开展。

3 小结

南昌职业大学平台主要用于对学生成绩擅长程度情况进行分析预测,包含的功能主要有用户管理、学生课程成绩管理、个人成绩分析、班级成绩分析等功能。平台采用angularjs作为前端框架,使用flask轻量级框架用于前后端交互进行对数据库的访问,使用决策树算法中的cart算法对学生成绩进行分析预测,对决策树进行剪枝降低树的高度防止过拟合,不断调参来优化决策树模型,使分析预测达到一个较为精准的水平。

参考文献:

[1] 张丽芳.基于大数据环境下高校教育管理信息化创新[J].科学大众(科学教育),2020(1):164.

[2] 裴莹.大数据时代下高校教育管理信息化创新发展路径思路构建[J].现代经济信息,2019(34):467.

[3] 华晓庭.高校教育管理信息化创新发展策略[J].中学政治教学参考,2019(33):140.

【通联编辑:张薇】