文档介绍:第 35 卷第 1 期河南图书馆学刊 2015 年 1 月大数据对图书馆的影响研究范春玲(黑龙江省图书馆,黑龙江哈尔滨 150090)关键词:大数据;数据服务;图书馆摘 要:文章在简述大数据特点及与云计算关系的基础上,分析了大数据带给图书馆的机遇和挑战,同时提出了图书馆的应对策略。中图分类号:G250. 76 文献标识码:A 文章编号:1003 - 1588(2015)01 - 0124 - 03收稿日期:2014 - 12 - 20作者简介:范春玲(1978—),黑龙江省图书馆副研究馆员。本文系 2013 年度国家社科基金艺术学项目“公共数字文化技术保障体制研究”的研究成果之一,项目编号:13CB128。1 引言随着信息技术的飞速发展和各类网络终端的涌现,全球数据量呈现爆炸式的增长。据国际数据公司(IDC)的报告结果:2010 年为 1. 4ZB,2011 年增长为1. 8ZB[1],到 2020 年,全世界所产生的数据规模将达到今天的 44 倍[2],大数据时代已悄然来到。最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,之后《纽约时报》和《华尔街日报》都在专栏封面上推出了该概念。自此,国际上尤其是美国等发达国家掀起了探究大数据的热潮。 2012 年奥巴马政府投资 2亿多美元推出“大数据的研究和发展计划”,拉开了大数据作为全球性发展战略计划的大幕。目前,大数据技术还处于探索发展阶段,尚未得到广泛应用。但笔者认为,作为以信息保存、开发和利用为首要任务的公共图书馆来说,应明确认知,在大数据时代对纷繁复杂数据的保存和分析是必须面对的挑战。同时,图书馆人还应以特有的信息敏锐性和职业前瞻性来思考大数据对未来图书馆发展的影响。2 大数据概述大数据是互联网发展到现今阶段的必然产物,是由人们日益普及的网络行为所伴生的,受到相关组织、企业采集的,蕴含数据生产者喜好、真实意图的,非传统结构和意义的数据。因此,大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。基于大数据分析的情报信息成为组织机构、企事业单位进行科学决策、生产发展、科技创新的主要依据,因此业界有三分技术、七分数据,得数据者得天下的说法。2. 1 大数据特点大数据的概念自提出以来,仁者见仁,智者见智,目前尚未有让大家认可的标准表述。但业界对大数据的4V 特性保持了一致意见,即:Volume(大量)、Variety(多样)、Velocity(高速)、Value(价值)。大数据的 4 个“V”也就是 4 个方面的特点:①Volume 指数据体量巨大。从 TB 跃升到 PB 级别,也就是只有 PB 级别的数据才可称为大数据。②Variety 指数据类型繁多。如目前流行的网络日志、视频、图片、地理位置信息等众多类型的数据。③Velocity 指数据处理速度快,即可从各种类型的数据中快速获得高价值的信息,这和传统的数据挖掘技术有着本质的不同。④Value 指只要合理充分利用数据并对其进行准确、正确的分析,将会带来非常高的价值回报[3]。2. 2 大数据与云计算的关系大数据的数量级通常达到 PB 级别,必然无法用单台的计算机进行处理,而必须采用分布式架构。分布式架构的特点是对海量数据进行分布式数据挖掘,但它必须依托云计算的虚拟化技术、分布式数据库、