文档介绍:Data Domain 技术白皮书
综述
Data Domain DD600/800 Restorer 产 品 是 基 于 硬 盘 的 备 份 存 储 器 件
(appliance)。尽管 DD600/的。DD600/800 由于接受磁盘随机访问的特性,其性能比磁带高出很多。
DD600/800 的在线保存技术和中转平台技术的比较
由于 DD600/800 可高效地保存数月的备份数据,所以从 DD600/800 上实现的恢复就算不是全部,也是绝大部分。这与以磁盘为中转设备的以磁带介质为主的恢复不同。在某些备份系统中,磁盘是作为磁带的缓存使用的。在缓存的方案中,备份数据首先会被导向或中转到磁盘上。在备份数据复制到磁带上后,为了下一次的备份腾出空间,磁盘上缓存的数据就会被删除。这种备份方式可以利用到磁盘的速度优势以提高备份性能。不过在恢复时还是需要磁带来完成,所以影响性能的定 位、加载和一序列磁带的挨次访问等问题照旧存在。
DD600/800 用于灾难恢复的异地复制
DD600/800 让异地复制或网络仓库(network vaulting)方案更加简洁、快速、成本更低。可选的 Data Domain Replicator 软件利用 DD OS 特有的优势特性,将在两个 DD600/800 之间通过网络的异步备份数据复制构建得更为简洁和高效。通过接受 Replicator,数据首先经标准的备份软件备份到本地的 DD600/800 上;随后本地的 DD600/800 会作为“发起端”通过 TCP/IP 或广域网 WAN 将数据复制到远端的复制用 DD600/800 上。
由于容量优化(Capacity Optimization)技术的缘由,与其他基于磁盘的备份系统相比,其通过广域网传输的数据量削减了 95%以上。假如必要的话,数据可以通过网络以同样的效率从异地的复制端恢复,或者将异地的数据直接在异地恢复。异地的复制用 DD600/800 也可以把数据导入到磁带上以便存档。所以说一对Restorer 的复制性能远远高于实际物理链接所能够供应的性能。在 ESG 试验室所演示的性能高达 450MB/s,这是由于对于整个要传输的镜像来说只会传那些唯一的数据段。
全部的备份都被定向到 Site A的磁盘设备; 全部的备份数据都被异步复制到 Site B;
既可以在 Site A也可以在 Site B 恢复文件; 磁带被转用于长期归档应用;
DD600/800 到磁带的拷贝
当为了长期存档的目的而需要将数据拷贝到磁带上时,单个 DD600/800 就足以供应足够的数据流以便让一台高端的磁带机发挥最佳的性能。而在做往磁带上拷贝数据的同时,DD600/800 还可以执行备份和恢复操作。与使用磁带相反,在做磁带归档操作时,假如需要从 DD600/800 上恢复数据是不需要停止归档操作的。
DD600/800 将高吞吐量,可以保存很多星期备份数据的存储容量,随机访问特性,以及通过网络的高速复制这些优势结合在一起,从而大大改善了整个备份和恢复过程。
为高效益恢复存储而设计的容量优化技术
备份数据中会包含太多的冗余部分,而当我们将某一周的全备份镜像和其随后的各个周的全备份镜像相比尤其如此。尽管增量备份只是取那些变化的文件,但增量备份中通常会包含冗余的数据块。
DD OS 容量优化(Capacity Optimization)技术是通过只保存唯一一份备份镜像冗余部分中的数据段来实现的。当数据写入到 DD600/800 时,数据会被分成可变长度的数据段,也可以说一序列的字节。 DD OS 会实时将该数据段与已经存储的各数据段做比较。这种方式保证每个唯一独特的数据段只保留一份。所以 DD OS 可以在文件内或文件间,甚至是数据块内发觉重复的文件和数据段。实际所需的存储空间也就相对于所保存的数据量低一个数据量级。
要使得容量优化有效率的关键是要不依靠于数据格式。 DD OS 的实现方式—
—全局压缩( Global Compression)——是基于对数据内容和重复模式的争辩分析而定的。Global Compression 技术可以应用到任意类型的重复数据——结构化数据
(比如数据库)或者非结构化数据(比如文本文件,存储在文件系统或原始卷
(raw volume)上的数据)。DD OS 通过接受 Global Compression 技术,不管什么样的数据格式,都可以实现高效率的备份。其实容量优化技术所依据的原理并不是新消灭的,而是在学术圈里已经存在数十年了(参见本文档的参考文献) 。Data Domain 的实现方式和学问产权在优化算法中属于性能卓越