王顺平

(河南科技学院信息工程学院,河南新乡453003)

数据挖掘技术与应用探讨

王顺平

(河南科技学院信息工程学院,河南新乡453003)

随着科学技术的快速发展进步,信息产业迅速崛起,打造了一个崭新的信息世界。在这种背景之下,数据和数据库管理系统的广泛应用成为时下热点,为各行各业带来了新的发展动力和活力。与此同时,也应当认识到数据库管理系统的不足之处。从当前来看,数据库管理系统能够做的事情还比较有限,仅能对现有数据进行存储和查询等工作,能够有效利用到的数据信息也极为有限。如何有效利用如此巨大的数据价值,成为目前在数据方面应该思考的重要话题,同时也是研究的一个新方向,即数据的挖掘技术。该文主要对数据挖掘技术及其应用进行相关探讨。

数据挖掘;技术;应用

随着人类生活中的数据爆炸式增长,数据提取分析的能力已经无法满足人类社会的发展需要。而当前的数据库管理系统的功能比较简单,仅仅能够进行数据的存储和查询统计等简单功能。对于大量数据的关系分析与规则整理,无法进行判断,对数据未来发展的趋势也无法准确预测。由此存在着数据巨大,而数据的利用不足的现象。为此,进一步衍生出了数据挖掘技术,迎合了数据快速发展需要,是一种新的信息资源开发和数据处理技术。

1 数据挖掘的定义

所谓数据挖掘,又叫做数据库中的知识发现,简称为KDD。关于数据挖掘技术的定义,国际上目前比较广泛认可的是U.M.Fayyad等人说明的,即数据挖掘技术就是在模糊的、有噪声的、不完全的、大量的、随机的数据中,提取潜在的、人们事先不知道的、隐含在其中的有价值的知识与信息的过程。这种提取出来的又加之的信息和知识表示为Concepts、Rules、Regu⁃larities,即概念、规则以及规律。总而言之,数据挖掘及时是一种通过决策支持过程,进而分析原有数据,再进行归纳与推理的模式,能够从原有数据中挖掘潜在的有价值的信息,为有需要的人员提供决策依据参考。

2 数据挖掘的过程

数据挖掘技术表现为一套流程或过程。对数据挖掘技术的介绍,可以从其目标定义、数据准备、数据挖掘、结构解释和评估四个阶段分别进行探究。

(1)目标定义

数据的挖掘,首先要对数据挖掘目标进行明确的定义。数据挖掘是否能够成功,与其目标定义有着重要的联系。因此,技术人员往往应该重视数据挖掘的目标定义。且这部分工作往往需要有经验的技术人员或者专业能力较强的专家进行紧密合作,开展目标定义。目标定义主要有两个方面,一是对数据挖掘的要求进行明确,二是确定可用的算法,这要对多种算法进行学习和比对。

(2)数据准备

数据准备是数据挖掘技术中的重要过程。这个过程一般可以分为三个小过程,即数据的选择、数据的预处理以及数据的变换。首先,要在数据库中筛选可用的价值数据;,其次,要对选择的数据进行相应的处理,达到数据挖掘要求;最后,通过数据的变换,来使数据维数达到要求。

(3)数据挖掘

数据挖掘阶段是数据挖掘技术的主要工作,是技术实际开展工作的阶段。首先,要对数据挖掘的算法进行规划,确定数据挖掘的算法;其次,选择最为合适的数据挖掘方法,挖掘方法必须与选择的算法相结合,没有冲突。在以上工作完成的基础上,进行正式的数据挖掘工作,运行数据挖掘的算法,完成数据挖掘目标。数据挖掘阶段极为重要,是数据挖掘进行的主要模块。

(4)结果解释与评估

数据挖掘的结果解释和评估阶段,是整个过程的成功验收阶段。首先,结果解释和评估要根据最开始的目标定义对提取的数据进行分析,将其中的主要信息提取出来;其次,对数据挖掘模式与计算机进行评估,观察有无存在无关的模式或者不必要的数据,在这个阶段可以将这些数据或者模式剔除,如果模式不符合要求,则应该返回到上一个阶段。最后,为了方便管理人员能够有效利用这些数据,需要对整个模式进行解释,将结果进行可视化,转换为通俗易懂的语言或模式。

3 数据挖掘技术的研究和应用方向

(1)研究方向

数据库挖掘技术在目前的应用并不广泛,主要限于其中有些关键性技术还没有实现,效率不高,准确性不强。当前数据库挖掘技术的研究主要有以下几个方向:第一是开发专业的数据挖掘系统,如空间数据库挖掘系统、关系数据库挖掘系统等;第二是进行挖掘算法的创新,实现高效率算法挖掘数据;第三是对数据挖掘结果的改良,不断提升数据挖掘结果的准确度,以便能够应用于更为专业的领域;第四是多源数据挖掘,通过计算机网络,实现多源连接;第五是强化数据挖掘的保密性与安全性。

(2)应用方向

随着数据挖掘研究的不断深入,数据挖掘技术已经初步成型,并取得了一定应用成就,且应用的领域范围越来越广泛,深入至政府管理、交通运输、科学研究、商业经营、传媒等各个行业和领域。如在科学研究当中,需要利用到大量的有价值数据,以往的数据分析工具明显无法满足需求。一些生物医学、天文科学等研究,对于数据的应用更加繁琐,而数据挖掘技术为此带来了极大的便利。比如在商业经营中,通过数据挖掘技术,可以有效实现数据库市场营销,分析潜在客户,准确进行目标市场定位,分析客户购买习惯等等。在未来,随着数据挖掘技术的进一步成熟,数据挖掘技术的应用将会越来越广泛。

4 结束语

综上所述,随着社会的快速发展,信息与数据的爆炸性增长,原有的简单的数据分析与处理无法进一步满足社会生产需要,容易造成数据的浪费。而数据挖掘技术的诞生,能够深入分析数据之间的关系,预测行为趋势,提取有价值的知识和信息,是当前数据应用的趋势。数据挖掘技术主要有目标定义、数据准备、数据挖掘、结果解释和评估四个阶段。同时,数据挖掘技术正在进一步研究发展,在未来,将会广泛应用于人类社会的各个方面,有效促进人类社会的发展。

[1]何波.大数据时代的数据挖掘技术与应用[J].电子技术与软件工程,2015(17):196-197.

[2]谈晓玉.数据挖掘技术在软件企业财务管理中的应用分析[J].现代商业,2016(2):45-46.

[3]张鸿雁.数据挖掘技术方法及其应用刍议[J].网络安全技术与应用,2016(5):59-60.

[4]刘妍.数据挖掘技术及其在医学信息领域的应用[J].科技传播,2016(19):132,138.

TP311

A

1009-3044(2017)19-0006-02

2017-06-10

王顺平(1979—),男,河南博爱县人,现任河南科技学院教师,职称助教,研究研究方向数据挖掘。