1 / 8
文档名称:

大数据存储方式概述.docx

格式:docx   大小:16KB   页数:8页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

大数据存储方式概述.docx

上传人:changjinlai 2021/5/5 文件大小:16 KB

下载得到文件列表

大数据存储方式概述.docx

文档介绍

文档介绍:大数据存储方式概述
随着信息社会的发展,越来越多的信息被数据化, 尤其是伴随着 Internet 的发展, 数据
呈爆炸式增长。从存储服务的发展趋势来看,一方面,是对数据的存储量的需求越来越大,
另一方面, 是对数据的有效管理提出了更高的要求。 首先是存储容量的急剧膨胀, 从而对于
存储服务器提出了更大的需求; 其次是数据持续时间的增加。 最后, 对数据存储的管理提出
了更高的要求。 数据的多样化、 地理上的分散性、 对重要数据的保护等等都对数据管理提出
了更高的要求。随着数字图书馆、电子商务、多媒体传输等用的不断发展,数据从 GB 、 TB
到 PB 量级海量急速增长。 存储产品已不再是附属于服务器的辅助设备, 而成为互联网中最
主要的花费所在。海量存储技术已成为继计算机浪潮和互联网浪潮之后的第三次浪潮 ,磁盘
阵列与网络存储成为先锋。
一、海量数据存储简介
海量存储的含义在于, 其在数据存储中的容量增长是没有止境的。 因此, 用户需要不断
地扩张存储空间。 但是, 存储容量的增长往往同存储性能并不成正比。 这也就造成了数据存
储上的误区和障碍。 海量存储技术的概念已经不仅仅是单台的存储设备。而多个存储设备
的连接使得数据管理成为一大难题。因此,统一平台的数据管理产品近年来受到了 广大用
户的欢迎。 这一类型产品能够整合不同平台的存储设备在一个单一的控制界面上, 结合虚拟
化软件对存储资源进行管理。这样的产品无疑简化了用户的管理。
数据容量的增长是无限的, 如果只是一味的添加存储设备, 那么无疑会大幅增加存储成
本。因此, 海量存储对于数据的精简也提出了要求。同时,不同应用对于存储容量的需求也
有所不同,而应用所要求的存储空间往往并不能得到充分利用,这也造成了浪费。
针对以上的问题, 重复数据删除和自动精简配置两项技术在近年来受到了广泛的关注和
这一做
追捧。 重复数据删除通过文件块级的比对, 将重复的数据块删除而只留下单一实例。
法使得冗余的存储空间得到释放,从客观上增加了存储容量。
二、企业在处理海量数据存储中存在的问题
目前企业存储面临几个问题, 一是存储数据的成本在不断地增加, 如何削减开支节约成
本以保证高可用性; 二是数据存储容量爆炸性增长且难以预估; 三是越来越复杂的环境使得
存储的数据无法管理。 企业信息架构如何适应现状去提供一个较为理想的解决方案, 目前业
界有几个发展方向。
存储虚拟化
对于存储面临的难题, 业界采用的解决手段之一就是存储虚拟化。 虚拟存储的概念实际
上在早期的计算机虚拟存储器中 就已经很好地得以体现,常说的网络存储虚拟化只不过是
在更大规模范围内体现存储虚拟化的思想。 该技术通过聚合多个存储设备的空间, 灵活部署
存储空间的分配,从而实现现有存储空间高利用率,避免了不必要的设备开支。
存储虚拟化的好处显而易见, 可实现存储系统的整合, 提高存储空间的利用率, 简化系
统的管理, 保护原有投资等。 越来越多的厂商正积极投身于存储虚拟化领域, 比如数据复制、
自动精简配置等技术也用到了虚拟化技术。 虚拟化并不是一个单独的产品, 而是存储系统的
一项基本功 能。 它对于整合异构存储环境、 降低系统整体拥有成本是十分有效的。 在存储
系统的