路玥

摘 要: 传统英语教师教学能力评价方法受主观因素制约,无法排除人为因素造成的影响,导致评价结果不可靠。为此,提出基于数据挖掘的英语教师教学能力评价方法。依据特征变量离散化原则对数据采取匿名化编码处理,对存在大量特征值的英语教师教学特征变量进行离散化处理。对英语教师教学数据进行粗糙集约简处理,将需挖掘的英语教师教学数据库采用粗糙集方法进行处理,确定决策表,设定最小支持和最小置信度,通过关联规则挖掘方法得出关联规则,从而实现英语教师教学数据挖掘。通过主成分分析对挖掘的英语教师教学数据集结构进行描述,获取评价指标。对英语教师教学能力指标进行计算,依据指标值评价英语教师教学能力。实验结果表明,所提方法评价结果可靠,可体现教师真实能力。

关键词: 数据挖掘; 英语教师; 教学能力; 评价; 约简; 变量离散化

中图分类号: TN911.1?34; TP391 文献标识码: A 文章编号: 1004?373X(2018)11?0153?04

Research on data mining based teaching ability evaluation of English teachers

LU Yue

(Tianjin University of Technology, Tianjin 300202, China)

Abstract: The traditional teaching ability evaluation methods of English teachers are influenced by subjective factors, and cannot eliminate the influence of human factors, which lead to the unreliable evaluation results. Therefore, a data mining based new teaching ability evaluation method of English teachers is proposed. According to the discretization principle of characteristic variables, the data is treated with anonymous encoding, and the English teachers′ teaching characteristic variables with large eigenvalues are discretized. The rough set reduction processing was performed for the teaching data of English teachers. The English teachers′ teaching database needed mining is processed with rough set method to confirm the decision table and set the minimum support and minimum confidence. The association rules mining method is used to get the association rules, so as to realize the teaching data mining of English teachers. The structure of teaching data set of English teachers is described by means of principal component analysis to get the evaluation index. The teaching ability indicators of English teachers are calculated to evaluate the teaching ability of English teachers. The experimental results show that the method has reliable evaluation result, and can reflect the true ability of teachers.

Keywords: data mining; English teacher; teaching ability; evaluation; reduction; variable discretization

0 引 言

教学能力评价为学校管理的关键阶段,有效完成英语教师教学能力评价有助于英语教师教学方法和内容的改进,使得英语教师教学能力有所提升[1]。但教学能力评价是一个非常复杂的过程,所以对教学能力进行科学的评价是非常困难而值得研究的问题[2]。

英语教师教学能力评价被教育部门和各高校广泛关注,最初通过人工形式进行评价,评价结果不可靠,无法体现真实的英语教师教学能力[3]。之后常通过专家系统实现英语教师教学能力的评价,然而由于与教学能力评价相关的因素较多,且专家系统容易受到自身水平的影响,无法排除人为因素导致的误差,导致评价结果不可信[4]。

为了提高英语教师教学能力评价精度,本文提出基于数据挖掘的英语教师教学能力评价方法。经实验验证,与其他方法相比,本文方法评价结果更加科学,可体现英语教师真实的教学水平。

1 基于数据挖掘的英语教师教学能力评价

1.1 评价指标数据库预处理

对全部英语教师教学样本数据集进行分析,因样本数据集中数据种类繁多,存在很多不相关数据。所以,需对数据进行筛选、离散化等预处理 ,以保证英语教师教学数据具有一定的规范性。本文遵循特征变量离散化原则,对表格采取匿名化编码处理,对存在大量特征值的特征变量进行离散化处理,由此提高英语教师教学数据挖掘效率,得到满意的挖掘结果[5]。通过预处理得到的样本向量为:

[Ui=ui1,ui2,…,uik,…,uiK] (1)

式中:[i∈1,M],[M]描述样本集合大小;[uik]描述样本集合中第[i]个样本[Ui]的第[k]个属性值。

1.2 英语教师教学数据挖掘

1.2.1 英语教师教学数据粗糙集约简

为了减少计算量,本节对英语教师教学数据进行粗糙集约简处理。用[R=S,B=D?E,H,f]描述英语教师教学信息系统。其中,[S]表示有限对象集合,也就是论域,[D]表示条件属性集,[E]表示决策属性集,若[D?E]为空集,则认为[R]是决策系统,[H]表示[D]与[E]的值域;[fa,d∈Hd],[?d∈B],[a∈S。]由此,[S]中的对象[a]都能够通过相应属性值[B]进行描述,属性值[B]代表[a]能够得到的信息。在决策系统内,各条件属性间通常具有一定的依附关系,即在不缺失关键信息的条件下,能够通过最简单的决策属性对条件属性集施行分类[6]。设[X]与[Y]是[S]中的等价关系[IND(X)],[Y]的[X]正域用[ZX(Y)]表示, [D1]表示条件属性集[D]关于决策属性集[E]的约简。若符合以下条件:

1) [D1?D],[D1≠?];

2) [ZINDD1INDE=ZINDDINDE];

3) 不存在[D2?D1,]使[ZINDD2INDE=][ZINDD1INDE] 。

则[D]的全部[E]约简集合可用[ξED]表示,[D]的全部[E]约简的交集被称作核,即[ψED=ξED]。可采用[D]关于[E]的任意约简取代[D],不会对决策造成干扰。

1.2.2 英语教学数据关联规则挖掘

本节采用粗糙集方法,将英语教师教学数据关联规则挖掘问题转变成求解关键数据集与其他数据集间关联规则的问题。

对象属性[B]由条件属性集[D]和决策属性集[E]构成,即[B=D?E]。把一个英语教师教学数据库内需求解关联规则的数据集通过粗糙集方式描述出来,即求解[R=S,B,H,f]中[D?E]的问题,其中,[D?E=?]。

1.2.3 教学数据挖掘

在上述分析的基础上,给出英语教师教学数据挖掘过程。设集合[A]为条件属性集[D]的子集,根据[A]确定的等价类被称作特征集,用[F]表示。若[A]中存在[n]个特征表述,则视[F]为[n]元特征集,用[Fn]表示,其中,[Fn]为[n]元特征描述,其表达式如下:

[Fn=D1∧D2∧…∧Dn] (2)

设关联规则最小支持度为[ε],若规则[Fn?E]的支持度高于[ε,]则认为根据[Fn]得到的[n]元特征集为频繁[n-]项集。用[Ln]描述频繁[n-]项集集合, [Vn]为[n]元特征集合,被称作[n]元候选集。

将需挖掘的英语教师教学数据库采用粗糙集方法进行处理,确定决策表[R],设定最小支持[ε]和最小置信度[λ]。通过关联规则挖掘方法,得出[D1?E]的关联规则,从而实现英语教师教学数据挖掘,过程如下,:

1) 输入[D1,][E,][ε,][λ];

2) 计算得到元候选集[Vn];

3) 求出候选集[Vn]的支持度,并与支持度[ε]相比,将大于[ε]的项保留,将小于[ε]的项去除;

4) 求出每个[n]元特征集[Fn,]并进行置信度判定,若大于置信度[λ],则跳至步骤5),反之仍保留在[Fn]中;

5) 删掉[Fn,]把规则存至规则库;

6) 采用交集运算得到[Vn+1,]并将[Vn+1]中无关项删除;

7) 对得到的集合进行判定,若不为空集,则跳至步骤3);否则停止计算。

1.3 英语教师教学能力评价

1.3.1 教学能力主成分分析

主成分分析法是一种把离散信息归至指定指标的统计分析方法,指定指标即为主成分,通过主成分对挖掘的英语教师教学数据集结构进行描述,获取评价指标[7]。主成分分析具体过程为:

1) 对指标数据进行归一化处理;

2) 对指标间的相关性进行判定,计算各指标权重;

3) 得出主成分数量[N];

4) 对主成分进行描述和命名,得到的评价指标通常包括一级指标和二级指标。

主成分为可体现样本成分的新变量,此变量能将与英语教师教学样本信息主成分轴相应的变量全部体现出来。

1.3.2 综合评价结果

对英语教师教学能力指标进行评价,评价指标值越大,表明英语教师教学能力越强[8?9]。本节评价指标值计算公式如下:

[Xi=j=1qQj?Pij] (3)

式中:[Xi]用于描述第[i]个英语教师教学能力评价值;[Qj]用于描述第[j]项指标的综合权重;[Pij]用于描述第[i]个英语教师第[j]项指标通过归一化处理后的评价值;[q]用于描述英语教师人数。

2 应用实例

2.1 本文方法应用结果

依据某学校的实际状态,本文设计的英语教师教学能力评价指标包含5个一级指标,所有一级指标均含有若干二级指标,通过本文方法对该校英语教师教学能力进行评价。当前该校英语教师教学质量评价指标如表1所示,限于篇幅,仅给出部分指标。

为了验证本文方法的可行性与准确性,在当地某学校进行实验验证,邀请10位英语教师参与实验,通过本文方法对10位英语教师的教学能力进行评价。首先对采集数据进行离散化处理,结果用表2进行描述。

通过本文方法求出权重,同时完成属性约简,结果用表3进行描述。

依据权重和评价数据获取10位英语教师教学能力评价结果,如表4所示。

通过本文方法对学校英语教师教学能力进行评价,结果如下:超过90分的教师占20%,超过80分低于90分的教师占30%,超过70分低于80分的教师占40%,低于70分的教师占10%。

为了验证本文方法的有效性,将传统加权平均值方法和模糊数学方法作为对比进行分析,加权平均值方法针对10位英语教师的评价结果如下:超过90分的教师占40%,超过80分低于90分的教师占40%,超过70分低于80分的教师占10%,低于70分的教师占10%。模糊数学方法针对10位英语教师的评价结果如下:超过90分的教师占70%,超过80分低于90分的教师占20%,超过70分低于80分的教师占10%,低于70分的教师占0%。显然,采用本文方法得到的评价结果更加科学公正。

2.2 与其他方法评价结果比较

为了评价本文方法的优劣,将传统加权平均值方法和模糊数学方法作为对比,将三种方法评价结果和实际结果的相关系数看作衡量评价方法优劣的标准,结果如图1所示。

分析图1可得出以下结论:本文方法评价精度比传统加权平均值方法和模糊数学方法高,这是因为与其他两种方法相比,本文方法能够提供更多体现英语教师教学能力的信息,大大增强了评价精度,得到的评价结果可反映英语教师的真实教学水平。

3 结 论

本文提出基于数据挖掘的英语教师教学能力评价方法。对英语教师教学数据进行离散化处理,挖掘有效的英语教师教学数据。通过主成分分析对挖掘的英语教师教学数据集结构进行描述,获取评价指标。求出英语教师教学能力指标值。经实验验证,所提方法评价结果可靠,可体现教师真实能力。

参考文献

[1] 尹亚晶.基于数据挖掘的体育评价决策支持系统开发与研究[J].现代电子技术,2017,40(9):108?111.

YIN Yajing. Development and research on sports evaluation and decision support system based on data mining [J]. Modern electronics technique, 2017, 40(9): 108?111.

[2] 梅毅,熊婷,罗少彬.复杂属性环境下NoSQL分布式大数据挖掘方法研究[J].科学技术与工程,2017,17(9):239?243.

MEI Yi, XIONG Ting, LUO Shaobin. Research on NoSQL distributed big data mining method in complex attribute environment [J]. Science technology and engineering, 2017, 17(9): 239?243.

[3] QI L, ZHENG Z. Trajectory prediction of vessels based on data mining and machine learning [J]. Journal of digital information management, 2016, 32(11): 131?134.

[4] 胡文红,孙欣欣.基于时间序列的数据挖掘技术在城市内涝灾害中的应用研究[J].科技通报, 2016,32(6):229?231.

HU Wenhong, SUN Xinxin. Study of data mining technology in application of city water logging based on time series [J]. Bulletin of science and technology, 2016, 32(6): 229?231.

[5] 杨可晗,马琼.大数据下提高远程教育质量提取有效资源仿真[J].计算机仿真,2017,34(4):212?215.

YANG Kehan, MA Qiong. To improve the quality of distance education and the simulation of effective resources under the big data [J]. Computer simulation, 2017, 34(4): 212?215.

[6] 陈海建,戴永辉,韩冬梅,等.开放式教学下的学习者画像及个性化教学探讨[J].开放教育研究,2017,23(3):105?112.

CHEN Haijian, DAI Yonghui, HAN Dongmei, et al. Learner′s portrait and individualized teaching in open education [J]. Open education research, 2017, 23(3): 105?112.

[7] 蔡晶晶.高职青年英语教师教学能力核心指标研究[J].无锡职业技术学院学报,2014,13(1):51?54.

CAI Jingjing. Research on the key indicators of young English teachers′ teaching ability in higher vocational colleges [J]. Journal of Wuxi Institute of Technology, 2014, 13(1): 51?54.

[8] 陈春良,刘彦,张雅卿.基于IGAHP?熵?博弈论?Choquet积分的新型装甲装备通用质量特性评价模型研究[J].计算机测量与控制,2015,23(7):2438?2442.

CHEN Chunliang, LIU Yan, ZHANG Yaqing. Research on establishing evaluation index system of new type armored equipment common quality characters based on RST?QFD?Bayes [J]. Computer measurement & control, 2015, 23(7): 2438?2442.

[9] EKMEK?I E. Comparison of native and non?native English language teachers′ evaluation of EFL learners′ speaking skills: conflicting or identical rating behaviour? [J]. English language teaching, 2016, 9(5): 98.