胡家磊 孙婷婷

摘 要: 大数据的到来为图书馆的建设带来了新的机遇与挑战,如何建立以大数据支撑的图书馆个性服务,文章对此问题进行了研究。

关键词: 大数据 图书馆 应用

1.大数据的概述

大数据的概念起源于阿尔文·托夫勒在《第三次浪潮》中提出“大数据”一词。直到最近几年,由世界着名的咨询公司麦肯锡正式向世界提出“我们的大数据时代已经来临了”。政府与信息行业迅速以最高热情投入研究过程中。汇聚各种知识与信息的图书馆集合了信息新技术和新理念的前沿,当然“大数据”在图书馆亦是如此。在美国等发达国家,大数据已经充分被应用在图书馆等重要的领域中。

虽然大数据的提出已经有段时间,但是学术界至今对大数据还没能达成统一意见。对大数据的研究可以从以下方面进行:一是大数据是一个技术领域,其包括对数据的采集、保存、加工、分析、挖掘及对应用领域未来的预测和反馈结果。二是大数据是一种思维模式,认为在大量的已公开信息中,分析数据之间的内在联系,可以从纷繁复杂的信息中找到人们亟待解决问题的答案。三是大数据是一种资源,是一种信息多样化、增长速率快、多样化的信息资源,所以处理大数据需要新的处理模式。

大数据中的“大”比不是单指数据量的条目多、数据包数量多就是大,而是指在当今这个信息多元化的世界中,对某一对象的描述需要多方面的完整描述。在这一描述的过程中有时间和空间上的多维度全方位的描述。“数”指的是使用数据将对象具现化,只有将对象数据化之后才可以被计算机分析统计。“据”为证据,将现有数据中隐藏的预见性信息具现化。

2.图书馆在大数据下的发展机遇

2.1大数据为图书馆注入新的血液。在科技信息化时代,所有事物均可以数据化,事物的产生、发展、变化、灭亡都可以产生出大量数据,甚至这些变化的数据可以达到海量。信息的产生存在于各行各业中,每时每刻都有新的数据产生。如个人、科研、社会事物都能产生出巨量数据。这些数据的产生来源于社会活动或科研活动,与人类的生活息息相关,同时也关系着社会、经济、军事、科研等一系列相关事物。从这些数据中开发出并利用其中有用的数据可以对社会的进步与人类的生活产生极大的好处。图书馆作为数据的集中地,对收集这些大多数都是免费的数据有着先天的优势,这些数据对图书馆也是丰富的馆藏资源,可以极大地丰富图书馆的现存数据量,同时可以为社会科研提供大数据源和挖掘数据价值;图书馆可以利用这些数据源中的信息分析用户需求,指导图书馆的信息建设、提高服务质量、扩大服务范围。

2.2大数据技术促使图书馆服务能力得以可持续发展。在信息技术高速发展的今天,传统的图书馆服务平台已经无法完全满足用户的需求,同时传统的服务模式和传统的IT架构也无法适应数据量日益庞大的服务要求。因此,图书馆需要应用以大数据支撑的新型服务模式,不仅提供图书馆传统的数据获取、传递和存储,更实现数据挖掘的新技术,对数字信息资源进行更高层次的挖掘,建立更加智能的知识服务引擎。将学术搜索和资源搜索引擎、后台信息资源推荐引擎、知识实体服务引擎、使用者数据信息需求分析引擎及多媒体数据获取、存储、传递、分析预测引擎等。

在存储数据方面,图书馆坐拥论文数据库资源、期刊报纸等媒体资源、读者的历史借阅和检索记录、浏览者的个人信息等资源,在平日的工作中可以积累大量与社会经济文化息息相关的数据资源。在传统模式的服务下,这些数据在使用后就会被认为是无用的数据,被作为数据垃圾清理掉。但从大数据的新服务模式下看,这些被遗忘、沉睡、丢弃的垃圾数据可以产生出巨大的价值,产生出惊人的能量。例如,每个人都有兴趣爱好,在日常读书时就能反映出对某一方面的喜爱,那幺在图书馆的检索记录就能充分反映出一位读者的个性爱好。有这幺一部《大卫·贝克汉姆》的图书,就是从反向操作,对读者的浏览历史记录进行数据挖掘,为特定读者群体“私人定制”图书。经过总结认识发现,数据对图书馆的战略性作用,并随着大数据感念逐渐进入人们的生活。图书馆工作人员更加清晰地认识到大数据是图书馆的战略资源,得数据者得天下,同时对历史数据进行挖掘,观察数据产生的规律预测未来。大力收集各类多维度数据;积极进行深度数据挖掘,为社会上的数据供应商、出版社和企业等不同群体提供信息资源增值服务,实现数据共享产生联盟,展开与供应商、出版社和企业的合作。拓宽图书馆的业务基础,提高服务质量,实现图书馆的可持续发展。

3.大数据下图书馆服务的新发展

3.1增加多维度数据资源的采集,拓展图书馆的数字资源。图书馆作为人类文明的记忆地,肩负着保护人类文明的重要作用。大数据是人类文明的重要体现,尤其是其中的半结构化和非结构化数据。这些数据恰是图书馆提供细节服务不可或缺的资源。例如在中国和美国都有类似于国家记忆的项目,用来收集国家历史文化的特藏。随着大数据产业化发展,对于一般的图书馆而言,没必要收集所有数据存储,这样只能造成数据的冗余。一般性图书馆只收集两类资源,一是科研资源性数据,二是在图书馆新产生的RFID数据。

3.2植入科研过程。大数据环境下,科学研究进入了一个新的历史阶段。计算机图灵奖得主提出了以第四范式的协同化、数据化、网络化为主要特征的密集型科研。其中尤以大数据支撑的数据化最重要。通过数字化的交互管理数据,对海量的科研数据进行分析挖掘融汇,帮助科研工作者更加准确地得到预期结果。

3.3更加精准化的服务。图书馆的个性化服务一直是图书馆追求的目标和发展方向,也是图书馆持续发展的重要保证。在知识获取日益方便的今天,图书馆已经不是获取知识的唯一途径,这就促使图书馆服务需要更加个性化,为每一位读者提供更好的知识获取体验,为用户提供满意的可增值的信息服务。通过对用户的信息行为的分析,清晰把握用户的兴趣、意愿及偏好和知识应用能力,对用户的信息需求进行预测,为用户提供跟踪服务、知识关联服务等,建立以读者为核心的知识服务体系。

服务是图书馆的核心和灵魂,大数据的到来为图书馆注入了新的活力,带来了新的技术与思想及丰富的数字资源,通过大数据一定能建设出更加出色的图书馆。

参考文献:

[1]韦晓凯.大数据时代高校图书馆工作思考[J].河北科技图苑,2014(1):54-56.

[2]维克尔·迈尔—舍恩伯格,肯尼思·库克耶.大数据时代[M].浙江:浙江人民出版社,2013:107.

[3]喻国明.大数据的价值及分析技术的关键[J].新闻与写作,2014(4):1.

[4]樊伟红,等.图书馆需要怎样的“大数据”[J].图书馆杂志,2012(11):63-68.