吴宇平,刘 佳

(哈尔滨工程大学 信息化处,黑龙江 哈尔滨150001)

2020年初新冠肺炎疫情肆虐全球,快速落实国家相关政策[1]、实现疫情精准防控不仅有利于生产生活各项活动的有序恢复,而且可避免资源的过度使用,实现人员行动轨迹跟踪则是落实科学防疫、精准施策的重要环节。

高校作为分布全国的专门教育机构,既承担教学任务,也是国家地方相关科研活动的核心支撑力量,往往涉及上万名教师、学生、专职科研人员、后勤保障人员、离退休人员、教职工家属等,具有群体聚集性和构成人员的复杂性[2],加上遍布全国甚至全球的学生返校、教师必要的教学科研活动和学校的日常运行管理维护,快速、全面掌握学校万余名师生及校内居民、临时进出校等人员的行动轨迹,实现紧急情况下的人员行动轨迹快速摸排尤其困难。

高校的信息化管理系统通常是为服务师生的正常教学科研和管理活动建立,不具备突发公共卫生事件时的人员行动轨迹数据规范化服务能力[3]。论文以某校信息化处“人员行动轨迹数据”专项工作为例,探索如何充分利用学校现有的各类信息系统的人员行动轨迹相关原始数据,快速实现疫情防控紧急情况下的人员行动轨迹数据统一、规范化整合与应用,以及根据学校整体疫情防控需求的变化,快速实现对各项服务功能的完善和优化。

1 学校信息系统的特点

高校作为相对独立的单位,由于人员数量庞大和群体长期工作生活的特殊性,通常涉及几十个不同的部门分别管理相应的业务和为师生提供服务。相应地,各部门的业务信息系统也存在依据各自部门的工作需要建立各自独立运行维护的情况,从疫情防控的角度看,软硬件设施、网络接入、人员基本信息和行动轨迹相关原始数据等方面均存在不统一、不规范等问题,无法做到行动轨迹数据的即采即用,必须利用学校的信息化资源,通过对各信息系统的行动轨迹相关原始数据进行数据治理来实现[4-5]。

2 “人员行动轨迹数据”总体方案

2.1 总体技术架构和思路

“人员行动轨迹数据”总体方案充分考虑学校各类门禁系统和设备、健康打卡系统、学生返校审核系统等软硬件设施的陆续投入使用,以及不同疫情防控阶段和重点的变化,为满足当前和后续此类不确定的需求,结合学校各类信息系统的运行现状,综合研判,设计总体技术架构如图1所示:

图1 “人员行动轨迹数据”总体技术架构

(1)各信息系统的行动轨迹相关原始数据通过数据采集平台分别接入数据仓库对应的行动轨迹数据表[6];各类人员的基本信息通过数据采集平台接入、其他少量零散人员的基本信息通过手动维护的方式录入数据仓库的人员信息表中。

(2)通过行动轨迹视图统一对外提供行动轨迹数据查询和各类数据统计等服务,如特定人员的行动轨迹报告单、密切接触人员报告单、其他个性化行动轨迹数据查询与各类行动轨迹数据统计等功能。

(3)根据具体需求和大量行动轨迹数据表之间的关联性,由技术人员利用编程手段对行动轨迹数据表的数据进行规范,提取关键信息,同时连接人员信息表,形成标准化、信息丰富的行动轨迹视图数据。

2.2 “人员行动轨迹数据”所涵盖的人员范围

考虑到疫情传播的广泛性,疫情防控范围在可行的情况下应尽量扩大,因此需将行动轨迹与校园相关的人员均纳入“人员行动轨迹数据”涵盖的范围,主要包括教师、学生、专职科研人员、后勤保障人员、离退休人员、教职工家属、经审批进校人员等,应建立适用于防疫需求的涉及所有人员的人员信息表。

2.3 “人员行动轨迹数据”数据源

为充分掌握人员的行动轨迹,需尽量多地利用学校各类信息系统实时产生的行动轨迹相关原始数据作为行动轨迹数据来源[7],主要包括校门门禁系统、楼宇门禁系统、车辆门禁系统、图书管理系统、校园卡管理系统、健康打卡系统、学生返校审核系统等。

2.4 行动轨迹数据表和行动轨迹视图

为规范来源于各信息系统的行动轨迹相关原始数据和确保行动轨迹视图的可用性,行动轨迹数据表和行动轨迹视图应同时具备至少6个基本字段以及“数据来源、设备名称”等辅助字段。

2.4.1 6个基本字段及要求

数据ID(主键):唯一且不变;

证件号:要求是本人的学生学号、教职工工号、18位居民身份证号或其他有效身份证件号;

姓名:与有效身份证件一致;

时间:规范为“YYYY-MM-DD HH24:MM:SS”格式;

地点:根据实际情况,规范为“11号楼、14公寓、XX省XX市XX区”等学校标准地点名称、国家标准行政区划名称或统一的自定义地点名称;

行为:根据实际情况,规范为“进门、出门、餐厅消费、使用多媒体机、浴室洗浴、超市消费、健康信息填报”等统一的自定义行为名称。

2.4.2 辅助字段基本要求

数据来源:根据实际情况,规范为“校门门禁系统、楼宇门禁系统、车辆门禁系统、图书管理系统”等统一的自定义数据来源名称;

设备名称:规范为各信息系统中设备名称相关字段的数据,如“校门门禁手持机-北门1、校园卡机-美食城2楼35号窗口”等。

基于现有信息化资源及学校疫情防控需求,论文设计的总体方案架构主要涉及人员信息表的设计和维护、人员行动轨迹原始数据如何接入数据仓库,以及行动轨迹视图的建立和维护三项关键技术。

3 人员信息表设计和维护

3.1 字段设计

为给行动轨迹视图提供人员的基本信息,需建立行动轨迹所涉及的所有人员的信息表,包括人员的“证件号(主键)、姓名、性别、其他证件号、所属单位、人员类别、联系电话、常住楼宇、常住房间”等字段,各字段应采用统一规范的名称。对各字段数据的要求如下:

证件号:要求唯一且不变,且必须是本人的学生学号、教职工工号、18位居民身份证号或其他有效身份证件号;

姓名:要求是本人的有效身份证件的姓名;

性别:要求是“男”或“女”;

其他证件号:要求是本人的18位居民身份证号或其他有效身份证件号,不能是学生学号或教职工工号;

所属单位:根据实际情况,规范为“船舶工程学院”“XX公司”等学校标准单位名称或统一的自定义单位名称;

人员类别:根据实际情况,规范为“教职工”“本科生”“研究生”“校内居民”“经审批进校人员”等学校标准人员类别名称或统一的自定义人员类别名称;

联系电话:要求是本人的常用联系电话号码;

常住楼宇:根据实际情况,对于常住校内的人员规范为“14公寓”“23栋”等校内标准楼宇名称,对于常住校外的人员规范为“校外住址-XXXX”;

常住房间:根据实际情况,对于常住校内的人员规范为“1107”“5-203”等校内标准房间名称,对于常住校外的人员规范为“校外住址房间-XXXX”。

3.2 人员信息表建立和维护

人员信息表建立应遵循三个基本要求:格式规范、人员全覆盖且便于适时调整补充、人员信息记录具有唯一性[8],其中,人员全覆盖和人员信息记录的唯一性是该部分的关键。格式规范和人员全覆盖可通过数据接口自动接入和人工手动添加相结合的方式对人员信息表进行持续维护来实现,下面就如何保证人员信息表中的人员信息记录唯一性的方法进行阐述。

3.2.1 建立人员信息表的人员信息来源的基本原则

对于有学号的学生、有工号的教职工,人员信息分别从学生管理系统和人力资源管理系统自动接入;对于校内居民和经审批进校人员,人员信息可根据信息系统数据支撑实际情况、数据量大小、数据更新频率等选择数据接口自动接入或人工手动添加;对于其他零散人员,无信息系统数据方便接入的,则在人员信息表中手动添加。

3.2.2 保证人员信息表的人员信息记录唯一性的策略

因人员信息表中的人员包括学生和教职工,他们也可以在某些行动轨迹数据来源系统(如支持18位居民身份证刷卡的校门门禁系统)中使用非学号和工号的其他有效身份证件号,简单地将各类人员信息接入到人员信息表将会导致某些人员在信息表中有多条记录,在行动轨迹视图中连接人员信息表时会出现错误,导致行动轨迹视图的数据不准确[9]。针对该问题,论文方案设计了一种有效的解决方法:(1)对于学生和教职工,人员信息记录只将学生学号和教职工工号作为证件号,将其18位居民身份证号或其他有效身份证件号作为字段其他证件号下的数据;(2)对于没有学生学号或教职工工号的人员,优先将其18位居民身份证号作为证件号,如没有则将其他有效身份证件号作为证件号,其他证件号与证件号相同;(3)每日对人员信息表执行SQL程序自动检查,发现问题及时处理,维护人员信息表满足应用要求。

4 行动轨迹原始数据接入数据仓库

4.1 行动轨迹数据的时间统一

为避免各信息系统的行动轨迹原始数据产生时间存在偏差,影响行动轨迹数据的准确性,在将各信息系统数据库中的行动轨迹原始数据接入数据仓库之前,应首先确保各信息系统的时间同步[10]。因各信息系统所属业务单位、管理情况各不相同,存在个别信息系统无法通过时间服务器进行同步的情况,行动轨迹数据的时间精度控制在秒级即可满足需求,可由系统管理人员负责定期对其进行手动调整与国家标准时间同步,其他信息系统均通过时间服务器与国家标准时间同步。

4.2 行动轨迹原始数据的规范化

为减少接入数据仓库后通过行动轨迹视图处理的复杂度,降低对行动轨迹服务器资源的占用,需初步规范各信息系统的行动轨迹原始数据。根据各信息系统行动轨迹原始数据的实际情况和信息系统建设厂商的支持情况,尽可能地在信息系统端规范好行动轨迹的“时间、地点、行为”等字段的数据[11]。

4.3 行动轨迹原始数据接入

为各信息系统分别建立数据接口,从各信息系统的数据表或专门开发的数据视图对接行动轨迹原始数据进入数据仓库的行动轨迹数据表中,并配置好数据采集更新机制,每天专人检查,确保行动轨迹数据按要求正常入库。为确保行动轨迹数据表中始终有数据,数据接口应设置为根据“数据ID”字段进行增量更新,更新频率可根据数据量大小、服务器资源等实际情况进行设置。以楼宇门禁系统的原始数据通过ODI平台[12]接入数据仓库为例,数据接入流程如图2所示。

图2 ODI平台数据接入流程

5 行动轨迹视图规范化建立和维护

(1)由于各信息系统的管理和使用情况各异,为避免行动轨迹数据表的“地点、行为”字段的数据不尽统一的情况出现,需兼顾行动轨迹数据需求和数据的实际情况综合考虑,在行动轨迹视图中可通过程序代码将各行动轨迹数据表规范为统一的、简洁明了的行动轨迹数据[13],如利用“SQL CASE…WHEN…THEN…”语句规范行动轨迹数据。

(2)利用SQL UNION操作符整合不同信息系统来源的行动轨迹数据表数据[14]。UNION操作符用于合并两个或多个SELECT语句的结果集,UNION内部的SELECT语句必须拥有相同数量、相同顺序和相似数据类型的列,因此,在行动轨迹视图中将各行动轨迹数据表数据通过SELECT语句输出结果时必须遵守以上规则。

(3)利用SQL LEFT JOIN操作符向以上整合后的行动轨迹数据加入更丰富的人员信息,如“性别、所属单位、人员类别、联系电话”等字段。需要注意的是,会有某些学生和教职工通过刷18位居民身份证进入校园的情况,如仅在行动轨迹视图中“LEFT JOIN人员信息表ON整合后的行动轨迹数据.证件号=人员信息表.证件号”,则此时将匹配不到人员信息,因此还需“LEFT JOIN人员信息表ON整合后的行动轨迹数据.证件号=人员信息表.其他证件号”以获取人员的性别、所属单位、人员类别、联系电话等信息。

(4)一般情况下,仅利用SELECT语句查询行动轨迹视图即可提供各种纬度的行动轨迹数据和统计数据。在面对复杂的、个性化的数据需求时,视图数据的定制数据、合并分割数据、简化操作、动态性等优势[15]即显现出来,在无需改变原始行动轨迹数据的情况下,可采取对行动轨迹视图进行调整、加入新字段等方法来解决。

部分行动轨迹视图规范化的程序代码如图3所示。

图3 行动轨迹视图部分程序代码

6 结论

本论文研究了在疫情防控的紧急情况下,基于学校现有用于教学科研活动管理的信息系统、数据采集平台、数据仓库等信息化资源,研究如何灵活运用数据视图、数据表、SQL程序等常用技术快速整合规范各类门禁系统、校园卡管理系统、健康打卡系统和学生返校审核系统等实时产生的行动轨迹相关原始数据,通过行动轨迹报告单、密切接触人员报告单和其他个性化行动轨迹数据查询与各类数据统计,为学校相关单位实施疫情精准防控提供数据支撑,实际应用效果证明该系统不仅有效地保障了学校疫情防控的效果,同时也降低了学校在疫情防控上人力物力的投入,提高了疫情防控的效率,保障了学校各项活动的正常有序开展。