姚琦敏

摘要:数据中心作为各大IT新技术的交汇点,已成为各行业信息化建设不可或缺的一部分。高校是教育行业的典型代表,其运作过程将产生大量数据,现有高校数据中心往往存在资源浪费、运维困难、可靠性低、信息孤岛严重等诸多问题,因此迫切需要建立一个完整、规范、开放、高效的数据中心来提升高校的信息化管理水平。文章提出在高校现有数据中心的建设基础上,通过构建标准数据共享体系和建设基于OpenStack的校级私有云数据中心来提高高校的数据管理质量水平。

关键词: 数据中心;云计算;高校信息化;数据共享;OpenStack

中图分类号:TP393        文献标识码:A

文章编号:1009-3044(2019)15-0031-04

1 引言 

当前,信息化建设已成为我国发展和创新的重要战略。随着高校规模的不断扩大,高校信息化建设日趋重要。很多人认为有了电脑,可以上网,有很多软件用,信息化程度就上去了。其实不然,高校信息化实际上还在初级阶段,信息化的高级阶段应该是实现对数据准确快速查询、分析、管理、传输、共享和应用[1]。为了让高校信息化加速步入高级阶段,建设校级数据中心将是势之所趋。

数据中心是一整套以计算机、网络设备、存储设备、环境控制及各种安全装置等基础设施为支撑,以业务应用系统、网络技术、存储技术、数据库管理等技术为基础,以组织运作的数据为核心,按照统一的标准,实现具有数据分类查询、数据综合分析、数据备份、信息管理及服务等功能的一体化信息资源管理体系[2-3]。

面对高校数量繁多又庞杂的信息系统,新时期高校数据中心的建设也应该与时俱进。本文在高校数据中心现有的建设基础上进行总体分析,并对基于云计算的高校数据中心建设的总体规划进行探索与研究,旨在打造一个集中式统一管理的基于云计算的高校数据中心,提高高校数据收集与整理的效率,实现高校数据的科学管理、合理分析和充分应用。

2 高校数据中心建设存在的问题

当前,高校信息化过程不断推进,各部门纷纷根据需要建立了信息管理系统,如教务系统、科研系统、学工系统、资产管理系统、一卡通系统等,覆盖学校各业务层面,成为各高校日常业务处理不可或缺的一部分。传统的高校数据中心往往依托校信息中心或网络中心呈现,只是对业务系统的服务器集中存放,而实际是各部门独立分散管理,其主要存在以下问题:

(1)资源浪费严重

各学院、各部门之间需要各类信息系统处理日常业务,各院部的系统往往存在交集却独立重复建设,这就导致了大量资源的冗余和浪费。此外,传统数据中心多数系统资源分配不合理,扩展性差,很多资源平时用不上,高峰期又不够用且难扩展,如学生选课系统。

(2)运维人员不足

各部门积极独立研发各类业务系统,却缺少对系统的专业管理运维人员,使得数据中心可持续运行效果差,导致高校信息化建设止步不前。

(3)系统可靠性低

各业务系统往往没有进行高可用性设计,一旦服务器故障,系统就随之瘫痪,严重影响部门管理工作。更甚者,还会造成数据丢失,直接将部门以往工作毁于一旦。

(4)数据孤岛严重

高校信息化建设过程中不同部门根据各自需求独立建设了各类信息业务系统。然而,各系统间数据往往既独立又相互交叠,各系统数据标准的不同,使得各部门间数据难以实时共享和发挥数据关联作用,产生严重的“数据孤岛”。此外,数据的多部门管理,使得交叠部分的数据缺乏一致性,各部门往往重复派发数据收集任务,给二级学院增添了不少的工作量。

(5)数据管理效率低下

高校运行过程中将产生大量数据,分别由不同职能部门进行管理维护。不同部门数据归置分类不统一也不明确、交叠数据不一致,极大增加了数据管理的难度,使得传统高校各部门间数据流通还需要人工在不同系统间进行导入导出,并进行人工数据转换和比对确认,大大降低了工作效率。

3 基于云计算的高校数据中心建设

高校信息化进程的不断深入为高校带来了大量的信息系统、数字资源和电子数据,如何提高高校数据管理效率和如何有效控制建设成本已成为当前亟待解决的主要问题。这就需要创新数据管理模式,从校级层面规划并建立一个完整、规范、开放、高效的数据中心。为此,本文提出了基于云计算的高校数据中心建设,并对其进行总体规划设计。

3.1 建设目标

数据的高效管理主要包括数据的高效收集、存储、转换、共享、应用和维护[4]。一个完整的数据中心生态系统会涉及数据产生、数据采集、数据使用、数据中心开发、后台维护等五类人员。学生和教师是高校数据的主要产生人员,学生会产生学生的个人信息、专业信息、选课信息、成绩信息等数据,教师会产生教师的个人信息、工资信息、借用资产信息、教学信息、科研信息等数据。数据采集人员往往是负责学校的人事、教务、科研、资产管理等工作的高校职能部门。各个职能部门负责采集各自业务范围的数据,并对数据进行核对。数据使用人员包括学生、教师、职能部门及校外人员或单位。数据中心开发人员往往是对数据中心的各个信息系统和数据库进行开发设计、编码实现的外包厂商或校内技术人员。最后,数据中心和各信息系统需要技术人员进行资源调度、后台维护和更新,确保数据库、信息系统等的正常运行,避免因数据中心崩溃或数据丢失导致全校工作瘫痪。

数据中心的建设离不开这五类人员的共同参与,因此,数据中心的总体规划需要对上述人员和工作过程进行综合考虑。为了提高高校数据管理效率,需要将建设目标分为两个方面。一方面为了各部门数据能高效收集、转换和共享,需要建立校级统一的标准数据共享体系,促进各信息化系统的深度融合。另一方面为了有效控制数据中心的硬件、空间和运维成本,需要构建私有云平台管理数据中心,减少资源浪费,保证信息系统的稳定性、可扩展性和高可用性。

3.2 建设内容

基于云计算的高校数据中心建设从顶层设计上分为两块:一是校级标准数据共享体系建设;二是校级私有云数据中心建设。

3.2.1 建立校级统一的标准数据共享体系

数据收集是数据中心建设过程中的重点和难点[5]。各部门信息化水平的差异使得数据收集和部门间数据流通依然停留在人工阶段,需要多部门导出数据,重复采集和人工录入。例如一个教师的人事考核,涉及职称信息、科研工作量和教务工作量等,需要人事、科研、教务三个部门之间的数据共享,此时就需要行政人员在三个部门之间协调沟通,导入导出数据,流程烦琐,效率低下。

为了解决上述问题,需要建立校级统一的标准数据共享体系,对数据进行标准化统一管理,消除“信息孤岛”,实现高校数据高质量共享和应用。其建设内容如图1所示,包括校级信息标准、数据整合平台、公共数据库、数据交换平台和数据开放平台。

校级信息标准包括信息编码标准和数据标准。校级信息标准是数据中心建设的基础。它是全校所有信息系统开发设计时都必须参照执行的规范,有了统一、科学、规范的分类和描述,数据才能有序流通和共享[6]。此外,还需制定相关制度,要求数据采集人员、新增信息系统的开发人员必须严格执行校级信息标准的各项规则要求。

数据整合平台将各个信息系统生成的数据进行去冗余和标准化整合[7]。早期建立的信息系统种类繁多,标准各异,影响各部门数据的共享和管理,学校不能浪费人力财力物力全部推倒重建,因此需要数据整合平台对各部门数据进行标准化整合,从而打通“信息孤岛”,建成学生、教工、资产数据“三张表”,为数据分析、共享和开放奠定基础。

公共数据库用于存储经数据整合平台标准化后的结构化数据,包括五类:教职工数据、学生数据、政策数据、财务数据和资产数据。后续建设的信息系统将直接按照校级信息编码标准和校级数据标准对接公共数据库,不再通过数据整合平台进行数据标准化。

数据交换平台用于不同职能部门间数据的交换共享,各部门通过在数据交换平台上进行数据共享申请、权限审核等流程获取所需的其他部门的数据,整个流程无纸化办公。

数据开放平台以门户网站的形式呈现,用于学生、教师、家长、校外机构以及社会人士等查询、下载和应用。数据开放平台以服务为基础,开放办理业务所需的服务数据,在校师生、离校校友可以通过一个账号一站式查询、下载到自己在校的各方面数据。

3.2.2  校级私有云数据中心建设

面对高校数据中心规模的不断扩大,如何对高校数据中心进行开放共享和有效管理成为新一代数据中心的主要问题。云计算和虚拟化技术的引入,可以对数据中心的计算、存储、网络等资源进行有效整合、统一调度和合理分配,从而提高资源利用率,实现共享开放,便于运维,提升数据中心的整体服务性能[8]。因此,本阶段的建设内容是校级私有云平台建设、标准数据共享体系迁移部署。在完成校级标准数据共享体系建设规划的基础上,建设私有云平台对数据中心进行统一管理;在完成私有云平台建设的基础上,将校级标准数据共享体系迁移到私有云平台上,形成完整的校级私有云数据中心。

整个云数据中心分四个层面进行设计:基础设施层、云平台层、管理层和应用层,其总体架构如图2所示。

(1)基础设施层

基础设施层是云数据中心的基础,为云平台层提供服务器、存储、网络等物理设备资源。所有物理资源可以分布在不同机房中,但都被置入资源池中进行集中管理和统一调度,后续由管理层根据业务需求进行资源动态分配,物理服务器提供计算资源;存储服务器提供存储资源,用于存储海量数据;网络设备负责连通数据中心各个资源池。

(2)云平台层

云平台层是云数据中心最关键的部分,它为应用层提供云主机和云存储,为管理层提供资源管理和权限管理服务。云平台层的核心技术是虚拟化,将资源池的计算和存储资源进行动态组合成不同配置的虚拟机(VM)供应用层使用。

云平台层采用当前主流的开源云平台OpenStack进行搭建,主要分为计算模块(nova)、网络模块(neutron)、存储模块(cinder)、认证模块(keystone)等[9]。

Nova负责调度管理计算资源,提供虚拟机,主要实现根据管理员的需求去分配虚拟机所需的计算资源,并提供对虚拟机的资源配置进行灵活扩展或裁剪、虚机迁移等功能。

Neutron负责整个云平台的网络资源,可根据需求部署网络类型,如flat、vlan、vxlan等,可为虚机分配网络,还可根据数据中心区域配置网络,实现VPC(virtual private cloud)技术,完成数据中心不同区域间灵活互通或隔离。

Cinder负责存储资源的调度,在创建虚机时可将虚机的系统盘和数据盘都挂载在存储资源上。cinder提供不同厂商存储服务器的驱动,可根据需求选择不同类型的后端存储,确保数据安全可靠。

Keystone负责身份验证,主要实现用户访问资源需要的身份验证和不同用户角色的权限设置。此外,不同服务间资源的调用也需要向keystone注册并成功获取所访问服务的endpoint方可使用。

(3)管理层

管理层主要进行资源管理和权限管理,确保云数据中心的安全性和可靠性。

云数据中心需要专门的人员进行运维和管理,因此,首先需要专门设立一个部门负责云数据中心的建设和运维管理。设立最高权限管理员,通过OpenStack对云数据中心中的所有资源进行管理,包括集中管理各职能部门的服务器、存储和网络资源。最高管理员下放二级权限给租户管理员,租户管理员对接职能部门或二级学院。各租户是一个VPC,由租户管理员分配隶属本租户的云主机和云存储,按需求上线业务,设立共享和开放的数据范围,设置不同数据使用人员的访问权限。在管理资源时要充分考虑信息系统的阶段性高峰期,例如,教务处租户管理员可在选课高峰期根据需求为选课系统所在的云主机扩展计算资源和存储资源,选课时间段过后可回收资源用于处理其他业务。

为了保证服务质量,管理层需要建立并完善云数据中心管理制度和服务流程[10],定期进行人员培训并严格遵守流程规则,实现高校业务办理全程数字化和无纸化,让云数据中心发挥出最大的效用。

(4)应用层

应用层是云数据中心的顶层,向数据使用者提供两项基本服务:数据内部共享和数据对外开放,主要包括用户接口、各类信息系统、数据库、数据开放平台和数据交换平台,即统一的自助服务网站、校级统一的标准数据共享体系。

统一的自助服务网站由管理员部署在云主机和云存储上,可批量部署到多台虚机上,实现负载均衡和容灾备份。数据使用人员通过用户接口经身份认证后访问数据开放平台和数据交换平台,不同身份的用户拥有不同的访问权限,由管理层设置。

统一的标准数据共享体系也由管理员负责迁移部署到云主机和云存储上。数据交换平台用于内部职能部门之间的数据交换共享,避免重复数据采集、数据多头管理、信息孤岛等问题,数据开放平台用于对外开放数据,供家长、学生、教师等进行查询。二者均对接公共数据库,公共数据库中存放着经标准化后的数据。新应用系统直接在云平台上线,旧应用系统则需连同数据整合平台一起迁移到云平台上,各应用系统仍隶属原数据产生的职能部门进行管理和使用。学校对公共数据库中的数据进行清洗、建模、挖掘、分析、可视化展示,最终为学校发展、招生宣传、师生教育、校友调查提供方向。

3.3 优点

基于云计算建设的标准数据共享体系将具有如下优点:

(1)数据共享系统高可用,云平台自动检测故障,根据云主机自动迁移技术,宿主机发生宕机后,可自动迁移到资源充足的服务器上,提高了系统的容灾能力。

(2)结合云网络和VPC技术,可以随时对信息系统进行隔离和共享,增加了系统部署、管理和使用的灵活性、安全性。

(3)便于管理员对云主机的计算资源和存储资源进行扩展,管理海量数据,降低运维难度,操作简单,便于维护。

4 结论

基于云计算的高校数据中心改变了以往的数据管理模式,实现高校数据的一体化管理,有助于减少资源浪费,打通信息孤岛,开放共享数据,监测高校运行常态,为高校运营决策提供有效的数据参考,从而提高教学质量,促进高校更好更快发展。

参考文献:

[1] 刘娜,曾成,崔雪娇,徐占然.云计算环境下城市基础信息库的研究[J].物联网技术,2018,8(05):80-82.

[2] 祝世京,张艳,陈卫东. 关于区域数据中心总体技术部署相关问题研究[J]. 华南金融电脑, 2008(11): 2-5.

[3] 何艳平. 关于湖南高校数据中心顶层设计的思考[J]. 兰台世界, 2016(1): 43-44.

[4] 陈大富.高校数字化校园的数据中心平台建设[J].信息与电脑(理论版),2017(16):138-140.

[5] 李建. 大数据时代高校数据中心的建设构想[J]. 信息通信, 2018(1): 198.

[6] 林成. 基于数据中心的高校信息标准建设[J]. 中国新通信, 2017(17): 37-38.

[7] 唐长乐,王春迎.基于政务云数据中心的政府数据开放共享服务集成平台研究[J].情报资料工作,2017(05):13-19.

[8] 汤应.智慧校园基于私有云平台的数据中心建设研究[J].电脑迷,2018(10):181-182.

[9] 李志军, 孔朋朋, 雷振伍. 基于OpenStack的私有云平台设计[J]. 微型机与应用, 2016, 35(9):24-26.

[10] 李先毅,高山,刘柱,刘瑾.高校信息化运维体系中的校园云数据中心建设[J].华东师范大学学报(自然科学版),2015(S1):262-265+282.

【通联编辑:代影】