钟玉泉 罗学刚

摘要:钒钛科技数据分析整理将为钒钛战略资源综合开发利用和开发提供强有力的支撑。为了更好地整合钒钛科技文献数据,该文提出基于知识服务构建钒钛科技资源数据全流程共享服务平台,提供钒钛科学数据和文献资源的异构数据源汇集、整合服务,钒钛资源仿真计算服务和测试服务以及钒钛产学研资源综合利用交流服务。该平台为钒钛科技人员建立标准化、规范化的钒钛特色主体数据库,支撑面向广大钒钛产学研提供技术和数据服务的产业协同创新和数据共享服务。

关键词:知识服务;钒钛科技数据;钒钛特色数据库

中图分类号:G642        文献标识码:A

文章编号:1009-3044(2022)04-0019-03

1 引言

随着中国经济社会发展的加速、技术创新进步和各类钒钛产品市场的拓展,政府对攀枝花钒钛资源利用定位和产业规划发展目标更加明确,开发利用的深度和广度进一步加深,利用攀枝花丰富的钒钛资源,进一步做好钒钛资源综合开发利用,推进钒钛产业纵深发展,国家批准建立了攀西国家战略资源创新开发试验区,国家发改委牵头制定了《钒钛资源综合利用和钒钛产业发展“十二五”规划》,将钒钛资源的综合开发利用和钒钛产业的发展上升到国家战略。四川省委、省政府高度重视钒钛及相关产业的发展,将钒钛磁铁矿资源列为全省重点开发的四大资源之一,同时钒钛产业也被列为工业强省的七大支柱产业之一。为全面落实国家攀西战略资源开发试验区的部署,结合攀西战略资源创新开发试验区实际,需加强推动钒钛产业协同大数据创新平台的建设,以指导钒钛产业的信息处理和知识生产、管理、利用和创新,实现钒钛专业知识最大程度的共享与利用。

“数据驱动研发”是未来产业技术革新和升级的主要推动力,对于行业而言,积累钒钛数据、分析数据,是改进产品和工艺的关键因素。而钒钛产业链的特点导致钒钛数据采集和应用效率较低,从而影响钒钛产业的创新和增效。例如:(1)较长的钒钛产业链涉及的产品和工艺数据多源异构,传统的数据文件存储的管理模式导致信息检索和分析效率低;(2)不同企业对同类数据描述方式各不相同,数据一致性较差;(3)从采矿到成材深加工链条长,各企业形成数据孤岛,产品问题难以追溯原因,产业链统筹发展难度大;(4)钒钛产业的环境问题突出(例如钒清洁生产和钛冶炼),缺乏环境影响数据指导企业决策;(5)专家与技术资源分散,缺乏平台来驱动协同创新;(6)缺少基于数据的行业发展分析。

根据如上所述的问题,钒钛产业需要一个能够解决钒钛全生命周期数据管理和分析,为广大钒钛产、学、研、用、政提供技术和数据服务的产业协同创新和大数据服务平台。该平台是推动世界钒钛研究中心和产业园区由大变强,引领钒钛产业在全球制造业产业分工和价值链中占据领先地位的需要,是增强钒钛产业制造业集群竞争力,为建设世界一流钒钛创新基地提供高质量支撑的需要,是顺应钒钛产业发展规律,促进钒钛资源优化组合高效配置,高水平协同参与全球竞争的需要,最终将构建起钒钛产业平台经济体,引领世界钒钛产业的发展。因此,本文基于知识服务构建了钒钛科技资源数据全流程共享服务平台。该平台为钒钛科研人员提供钒钛科学数据和文献资源的异构数据源汇集、整合服务,钒钛资源仿真计算服务和测试服务以及钒钛产学研资源综合利用交流服务。

2 基于知识服务的整体平台构架

2.1平台描述

为了充分发挥四川钒钛资源集中的地缘优势和国家攀西战略资源开发试验区先行先试的政策优势,全力打造钒钛技术与钒钛科技数据共享服务的服务平台,打造促进钒钛科技成果产业化的支撑平台,打造数据共享服务平台,充分发挥大数据平台传播科技信息的基础性作用,通过整合积聚钒钛知识资源、创新数据管理分析服务、技术服务、行业标准、完善数据收集,科研协同创新,计算服务和钒钛科普教育服务等业务开展的钒钛科技数据共享,促进各类钒钛科研和生产数据的在线管理和分析服务,扩大攀枝花“钒钛之都”的影响力。

本平台主要循着“知识服务、数据管理、技术服务”这三个维度展开,即以数据资源整合建设完善的钒钛科技知识平台;以数据管理提供各类钒钛科研和生产数据的在线管理和分析服务;以技术服务推动技术要素的知识传播;平台立足于钒钛产业技术发展,着力钒钛知识服务,提高钒钛深度应用,促进钒钛产品服务,形成钒钛科研数据的标准。

平台建设内容主要有:

1)建设钒钛数据资源分类体系及元数据目录库。通过对各类钒钛相关信息进行描述、定义、分类与编码,建立一套完整、科学的钒钛科技数据的分类体系,并在分类体系的基础上建立钒钛信息元数据目录库。

2)整合钒钛数据收集与多源异构数据。包括数据录入、网络数据采集和多源异构数据的整合。

3)建设主体钒钛知识仓库。包括钒钛科学数据资源库、钒钛科技文献资源库、钒钛科技信息库、钒钛专利与标准库和钒钛科技人才库等 5 个子库。

4)实现计算服务和仿真实验服务功能。计算服务功能是借助攀枝花市钒钛资源优势,整合钒钛产业单位的计算硬件和软件资源,为用户在线申请或预约可用的计算资源进行计算,计算结果数据保存至数据服务相应数据库中,供用户查阅和分析;仿真测试服务可为钒钛中小企业提供钒钛专业数据和资源服务,通过平台提供的测试接口,可以完成目前钒钛研究重要的仿真软件的数据实验,提供软件共享服务。

5)建设钒钛特色资源知识共享服务门户。通过整合国内外钒钛相关知识资源,提供方便快捷的检索功能,建立完善、高效的信息知识服务系统,做到信息的保存、共享、统计、分析,实现资源的优化配置,实现知识门户、知识仓库、搜索引擎、互动平台、权限管理、系统维护等功能,为相关人员提供支持和服务,主要包括钒钛知识仓库检索、钒钛知识可视化、钒钛知识科普与统计、钒钛行业互动平台、专家库介绍以及数据定制化展示等服务。

2.2 平台体系结构

钒钛科技数据共享服务平台系统架构如图1所示。平台由下到上分为系统层、数据层、服务层、应用展现层。系统层是数据平台的硬件支持,数据层中存储钒钛的科学数据、文献数据和互联网资讯数据;服务层定义了服务平台的业务模块,如数据的采集、预处理、存储、搜索和分析等;应用展现层为用户提供操作界面接口与信息呈现,用户通过应用展现层使用平台提供的数据服务、资讯服务以及其它服务。

该平台的核心功能由服务层实现,服务层包括以下的功能模块:

1)数据采集与预处理服务提供对于各类数据的输出和输出前预处理服务,响应浏览器前端的数据获取,数据查询,数据排序,数据比较,数据关联,数据可视化等服务请求。

2)网络数据采集服务按照项目需求对服务栏目,网络采集资源数据,界面设计进行二次开发,给用户提供全面的钒钛材料专业知识服务,实现实时更新网络资源、一站式搜索信息(互联网资讯、文献、科技报告、专业知识)、个性化定制专业资讯、专题分析报告生成等功能。

3)数据存储管理服务提供对存储资源的抽象,支撑数据输入、输出、索引建立、数据备份恢复等上层功能模块。

4)数据搜索服务采用企业级的搜索引擎Elastic Search方案,提供对各类数据的索引建立和搜索访问。

5)论坛模块采用定制的Discuz平台,按照钒钛产业的特点实现论坛的功能需求。

6)权限控制模块为上层用户功能应用提供服务层接口,采用Spring Security技术支持用户类型建立,用户类型权限设置,用户权限检测;并采用Spring AOP技术,对于用户操作节点自动产生日志记录,实现数据的可追溯。图2描述了钒钛特色资源知识仓库,主要有CNKI钒钛科技文献资源,钒钛领域专家成果,科技文献库和其他相关资源构成。

3 钒钛科技数据共享服务平台实现

本平台的技术框架采用SSM(Spring、SpringMvc和MyBatis)框架技术实现,以知识服务为基础,前端以JSP和Ajax技术进行数据展现和交互,后端使用Java和MySQL进行数据访问和持久化操作,融合软件工程与面向对象编程思想构建。平台由下到上分为接口层、数据层、服务层、服务门户四大结构框架。接口层是数据平台的资源支持和数据采集,数据层中存储钒钛的科研数据、生产数据和互联网资讯数据,构架钒钛元数据目录库和分类体系,采用HDFS、MapReduce、Hive、NoSQL等数据处理和存储技术构建钒钛多源异构数据服务知识库;服务层定义了服务平台的业务模块,如数据的采集、预处理、存储、搜索和分析等;服务门户为用户提供操作界面接口与信息呈现,用户通过应用展现层使用平台提供的数据服务、知识服务以及其他服务。

实现的功能导航如图3所示,主要有钒钛文献数据库、金属数据库、微观组织、晶体结构、钒钛专利和标准库等模块构成。钒钛知识库是钒钛科技数据平台的数据仓库,其内容涵盖钒钛资讯、文献、统计、专利、标准、分析报告、科技报告、科普、成果奖励、专题分析、企业信息、专家人才等。数据来源于申报单位已有的钒钛信息资源,以及平台建成后通过互联网采集和信息情报单位购买的钒钛科技信息。通过统一的数据结构、统一的数据元编码方式、统一的信息存储方式、统一的信息资源目录体系和统一的信息交换体系建立共享的钒钛科技知识库。知识库中的信息资源存储在云端服务器,为整个钒钛行业用户提供行业信息和资源服务。

钒钛知识数据库的数据内容具体包括:①钒钛材料标准牌号性能数据库(包含标准号、化学成分、性能等数据);②钒钛元素相关的晶体结构数据;③钒钛实验二元相图及三元相图数据;④钒钛金属材料及合金微观组织数据;⑤钒钛科技文献可在线浏览题录;⑥钒钛国内外科技报告题录和原文;⑦钒钛行业资讯;⑧钒钛材料相关国内外专利数据;⑨钒钛人才信息数据。

图4为平台门户首页展示页面,有平台应用服务、专业知识应用服务和专业数据分析三大板块构成,主要实现功能描述如下:(1)专业知识管理分为资讯内容管理、科技报告管理、专利内容管理、微观组织管理、期刊论文管理、学位论文管理、书籍管理、企业库管理、专家库管理。(2)资讯内容管理:对已有的资讯内容进行修改或者删除,也可添加新的资讯。(3)科技报告管理:对已有的科技报告内容进行修改或者删除,也可添加新的科技报告。(4)专利内容管理:对已有的专利内容进行修改或者删除,也可添加新的专利内容。(5)微观组织管理:对已有的微观组织内容进行修改或者删除,也可添加新的微观组织。(6)期刊论文管理:对已有的期刊论文内容进行修改或者删除,也可添加新的期刊论文。(7)学位论文管理:对已有的学位论文内容进行修改或者删除,也可添加新的学位论文。(8)书籍管理:对已有的书籍内容进行修改或者删除,也可添加新的书籍。(9)企业库管理:对已有的企业信息进行修改或者删除,也可添加新的企业信息。(10)专家库管理:对已有的专家信息进行修改或者删除,也可添加新的专家信息。

4 结论

本文介绍了钒钛科技资源数据全流程共享服务平台,从钒钛产业的钒钛知识和专业数据管理应用的数据共享服务,建立钒钛科学数据目录数据库和海量多源异构的钒钛知识数据、专业数据的数据标准化和数据融合,平台需具备良好的扩展性,对各类非结构化知识数据和专业数据的采集和处理支持较好,实现了对各类钒钛知识和专业数据的管理以及各类分析应用工具的集成和扩展。

参考文献:

[1] 陈尚松, 杜旭英, 俞欢军. 基于Struts+Hibernate+Spring框架的毕业设计管理系统[J]. 计算机工程与设计, 2008(15):230-233.

[2] 叶小乐. 基于Struts和Hibernate的图书馆重点学科导航系统[J]. 图书馆学研究, 2008(9):34-37.

[3] 毕达天, 曹冉, 杜小民. 科学数据共享研究现状与展望[J]. 图书情报工作, 2019,63(24):70-78.

[4] 张绍丽, 郑晓齐, 张辉,等. 科技资源共享网络模式创新与实践——以中国科技资源共享网为例[J]. 科技管理研究, 2018,38(13):50-59.

[5] 席宁. 基于云计算的信息资源共享管理系统的构建[J]. 电脑编程技巧与维护, 2019(6):109-110.

[6] 蔡代纯. 个性化信息服务研究综述[J]. 图书馆学刊, 2007(1):86-87.

收稿日期:2021-06-10

基金项目:四川省重大科研平台建设项目(2019JDPT0014)

作者简介:钟玉泉(1967—),男,教授,博士,研究方向为科研管理与信息化建设;罗学刚(1983—),男,副教授,博士(后),研究方向为计算机视觉、图像处理等。